著者
徳山眞実 廣井慧 山内正人 砂原秀樹
雑誌
研究報告インターネットと運用技術(IOT)
巻号頁・発行日
vol.2013, no.40, pp.1-6, 2013-03-07

科学の進歩によって今まではデータとして扱うことができなかった人の感性や好みを情報化しようとする試みがなされている.本研究では「女子力」という曖昧な感性情報を数値化することを目的とし女子力の数値化手法を提案する.「女子力」という言葉は2001年に新しく作られた造語で女性ファッション誌や広告等で頻繁に使用されており,現代女性の女性らしさの尺度である.しかし,明確な定義はなく非常に曖昧なまま使用されている.そこで,これらの感性を数値化することで具体的な尺度になり,女子力を上げたいと望む女性の指標としてモチベーション維持や行動変容に繋がる可能性も考えられる.また,「女子力」だけでなく,女性らしさの尺度となっている言葉は数多く誕生している.それは女性の社会進出が進み人々が掲げる「女性像」というものが多様化してきているという背景からである.提案する数値化手法では情報の入力,処理,出力という3つのステップを行う.その為に入力情報の決定,基準値の決定,正規化を行う.そして実際に2つのケースを例にとり数値化を行う比較実験と,行動変容への可能性を探る実験の2つを行う.その結果から考察を行い,今後の課題を明らかにする.By the progress of science, The progress of science has been developed to enable to quantify personal preference and sensitivity. In this paper, this research proposes a method to quantify and measure 'Joshi-ryoku', with an objective to numerically measure sensibility is proposed. 'Joshi-ryoku' is a word used for women to develop their sense of style or fashion in Japan. It is a common term used among young girls to increase their attraction. This word 'Joshi-ryoku' is a coined word, created in 2001. In most cases by enhancing your 'Joshi-ryoku', many women tend to become prettier or more attractive.However, it has no clear definition and the way it is being measured is ambiguous, but the term is still used within the daily life. With the diversification of a women's image in our generation, the society has created many terms to define women's image. Our scale of 'Joshi-ryoku', can increase and maintain their 'Joshi-ryoku' motivation. The research methodology is conducted through three steps. First is by the determining the input of the information, second is to determine the reference value, and thirdly is normalization of 'Joshi-ryoku' scale. We quantify 2 samples. Our results shows the possibility that our method can quantify and measure ' Joshi-ryoku'.
著者
徳山眞実 廣井慧 山内正人 砂原秀樹
雑誌
研究報告インターネットと運用技術(IOT)
巻号頁・発行日
vol.2013-IOT-20, no.40, pp.1-6, 2013-03-07

科学の進歩によって今まではデータとして扱うことができなかった人の感性や好みを情報化しようとする試みがなされている.本研究では「女子力」という曖昧な感性情報を数値化することを目的とし女子力の数値化手法を提案する.「女子力」という言葉は2001年に新しく作られた造語で女性ファッション誌や広告等で頻繁に使用されており,現代女性の女性らしさの尺度である.しかし,明確な定義はなく非常に曖昧なまま使用されている.そこで,これらの感性を数値化することで具体的な尺度になり,女子力を上げたいと望む女性の指標としてモチベーション維持や行動変容に繋がる可能性も考えられる.また,「女子力」だけでなく,女性らしさの尺度となっている言葉は数多く誕生している.それは女性の社会進出が進み人々が掲げる「女性像」というものが多様化してきているという背景からである.提案する数値化手法では情報の入力,処理,出力という3つのステップを行う.その為に入力情報の決定,基準値の決定,正規化を行う.そして実際に2つのケースを例にとり数値化を行う比較実験と,行動変容への可能性を探る実験の2つを行う.その結果から考察を行い,今後の課題を明らかにする.
著者
宮下 剛輔 栗林 健太郎 松本 亮介
雑誌
研究報告インターネットと運用技術(IOT)
巻号頁・発行日
vol.2014-IOT-24, no.15, pp.1-6, 2014-02-20

システムの大規模・複雑化に伴い,サーバの構築・運用を効率化するために,サーバの状態をコードで記述する手法が数多く提供されている.それらの手法を効率良く扱うプロセスとして,テスト駆動開発の手法をサーバ構築に応用した Test-Driven Infrastructure が提案されている.このプロセスを支援するテストフレームワークもいくつか登場しているが,あるものは特定の構成管理ツールに依存,またあるものは OS 毎の違いを自ら吸収しなければならないなど,汎用性に難がある.そこで,本論文では,特定の構成管理ツールや OS に依存することなく,サーバの状態を汎用的かつ可読性の高いコードでテスト可能なテストフレームワークを提案する.提案手法では,汎用性を高めるために,これまでの OS や構成管理ツール固有の振る舞いを整理して一般化し,運用業務で発生するコマンド群,特に確認作業に関するコマンド群を体系化・抽象化した汎用コマンド実行フレームワークを定義する.続いて,テストコード記述の抽象度を高め可読性を上げるために宣言的かつ自然言語に近い記法で汎用コマンド実行フレームワークを操作できる制御テストフレームワークを定義する.これにより,管理者が OS や構成管理ツールの違いを気にすることなくサーバの状態を容易にテストできるようになり,サーバの運用・管理コストを低減できる.また,フレームワークを用途別に分離して定義することにより,制御テストフレームワークを独自の記述に変更する事も容易である.提案するテストフレームワークを serverspec と名付けた.
著者
森 幹彦 上原 哲太郎 喜多 一
出版者
情報処理学会
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.22, pp.1-7, 2011-02-21
被引用文献数
1

平成 15 年度に始まった高等学校普通科における教科 「情報」 を履修した学生が昨年度より大学に入学しはじめている.これに伴い大学では従来の情報リテラシ教育のあり方の見直しを迫られている.そこで本学では,教科 「情報」 の履修状況と関連した情報リテラシ修得状況を,平成 18 年度より新入生についてアンケート調査している.今年度も引き続き調査を行った結果,高校における教科 「情報」 の履修の傾向が安定してきていること,教科を履修させていない高校がまだ残っていること,アプリケーション利用に関するスキルは身についているが情報セキュリティに関するリテラシが十分とは言いかねること,プログラミングを習いたいとする意欲が高いことなどが明らかになった.The new subject "Information Study" in senior high school started in 2003 fiscal year and the students who finish the subject have come to enter the universities since last year. It forces universities to reconstruct the curriculum to fit the situation. Therefore, we made questionnaire surveys of the students who entered the university in each academic year from 2006 about the learning situation of the new subject and related information literacy. According to the result of this academic year, it was clarified that taking the subject "Information Study" in senior high school stably have tendencies, there still remains some schools which do not open the subject, the students have mastered the usage skill of software applications but have not enough mastered about information security literacy, and their greediness for learning programming languages is high.
著者
柏崎 礼生
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2017-IOT-37, no.13, pp.1-6, 2017-05-18

クラウドコンピューティングの登場により人々は強大な計算機資源を手に入れることができるようになった.クラウドコンピューティングをクラウドコンピューティングたらしめる属性の一つに従量課金がある.人々が強大な計算機資源を手に入れることと,その代償となる資本は等価交換される.一方で人々は時として意図せず強大な資源を利用し,意図しない代償の請求に苦悩することがある.本稿では意図しない利用によりクラウドコンピューティングプロバイダから 1 ヶ月で約 580 万円を請求された哀れな一個人の事例を紹介するとともに,その原因を説明し,意図と資本の齟齬を解消し得るモデルを提案する.
著者
北口 善明 近堂 徹 鈴田 伊知郎 小林 貴之 前野 譲二
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2017-IOT-36, no.13, pp.1-8, 2017-02-24

各オペレーティングシステムの IPv6 実装が進んだことで,IPv6 ネットワークが提供されればクライアント端末は IPv6 通信が優先となるケースが増えてきている.一方で,現在 IP アドレス自動設定の手法としては RA や DHCPv6 を用いたステートレス ・ ステートフル設定が RFC で策定され,その組み合わせによってはクライアントの意図しない挙動を誘発するだけでなく,ネットワーク環境へ与える影響も考慮しなければならない.本発表では,各種クライアント OS における IPv6 実装状況の検証結果を報告するとともに,これらがネットワーク運用管理に与える影響について考察する.
著者
大橋 滉也 北口 善明 山岡 克式
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2020-IOT-48, no.23, pp.1-7, 2020-02-24

IETF で仕様策定が行われている HTTP/3 は,UDP 上に輻輳制御や再送処理を再実装した QUIC を利用することで,主にモバイルネットワークなどの,固定回線に比べ低品質なネットワークでスループットが向上する.しかし,低遅延・低パケットロス率な高品質ネットワークでは,QUIC がユーザ空間で実装されていることなどにより,HTTP/2 よりも低い性能を示すことがある.そのため,いかなる場合でも HTTP/3 を利用することがコンテンツロード時間の削減につながるとは限らない.そこで本研究では,様々なネットワーク環境における HTTP/2 と HTTP/3 の性能比較を行った結果を元に,ネットワーク環境に応じてサーバ側での動的な利用プロトコルの制御を行い,コンテンツロード時間を削減する手法を提案する.これにより,最悪ケースにおけるコンテンツロード時間を 27.8%削減した.
著者
松本 亮介 平原 正裕 三宅 悠介 力武 健次 栗林 健太郎
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2017-IOT-39, no.13, pp.1-8, 2017-09-22

インターネットの利用に際して,ユーザーや企業においてセキュリティ意識が高まっている.また,HTTP のパフォーマンス上の問題を解消するために,HTTP / 2 が RFC として採択された.それらを背景に,常時 HTTPS 化が進む中で,高集積マルチテナント方式の Web サーバで管理している大量のホストも HTTPS 化を進めていく必要がある.同方式は単一のサーバプロセスで複数のホストを管理する必要があるが,Web サーバの標準的な設定を用いて事前にホスト数に依存した数の証明書を読み込んでおく方法では,常に確保しておく必要のあるメモリ使用量が増大することで,リソース効率が低くなり,収容数が低下する.そこで,Server Name Indication (SNI) を利用可能である条件下において,事前にサーバプロセスに証明書を読み込んでおくことなく,SSL / TLS ハンドシェイク時にホスト名から動的にホストに紐づく証明書を読み込み,メモリ使用量を低減させる手法を提案する.実装には,我々が開発した,mruby を用いて高速かつ少ないメモリ使用量で Web サーバの機能を拡張するモジュール ngx_mruby を採用して,動的にサーバ証明書を選択する機能を実装した.また,筆者が所属する GMO ペパボ株式会社のホスティングサービスにおいて本手法を導入し,証明書の数やサーバリソースの使用量の関係性,性能に関する評価を行った.
著者
飯田 嘉一郎 吉浦 紀晃
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2017-IOT-36, no.31, pp.1-8, 2017-02-24

近年では個人情報保護の意識が高まっており,個人情報を伏せたままの通信を可能にする匿名化通信が注目されている.匿名化通信を実現するもので最も普及しているのは Tor (The Onion Router) である.Tor はインターネットにおいて通信経路の匿名化を実現できるが,この匿名化の犯罪利用が非常に多く,早急な対策が必要とされている.本論文では,Tor を利用してインターネット掲示板に悪質な書き込みをするユーザを特定することを目的とする.本論文では,Tor の通信をキャプチャし,そのパケットの特徴を Fingerprint とする.この Fingerprint を利用して,掲示板ヘ書き込みを行ったユーザを特定するシステムを提案する.さらに,本論文では,この機能を実装し,Tor ネットワーク上で実験を行なった.そして,Fingerprint を利用した従来のユーザ特定手法よりも高い精度でユーザの特定が可能となった.
著者
金子 直矢 伊東 孝紘 勝田 肇 渡辺 敏暢 岡田 和也 阿部 博 大西 亮吉
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2022-IOT-56, no.3, pp.1-8, 2022-02-28

自動車の遠隔運転では,従来運転者が車内で知覚していた車の視覚・聴覚情報を遠隔地にいる運転オペレータに対して安定的に伝送しなければならない.本研究は,移動体通信回線を備えた自動車から遠隔地のオペレータ端末への映像伝送に WebRTC を用いる環境を想定し,通信品質向上への MP-QUIC プロトコルの適用可能性検証を行う.WebRTC は,インターネットにおいて端末・サーバ間で P2P 通信路を確立し通信を行うため,遠隔運転に必要な低遅延な通信を実現できる可能性がある.しかし,移動する自動車からの通信は不安定になることもあり,遠隔運転の安全性を高めるためにより安定した通信方式を確立しなければならない.そこで,本研究では複数の異なる通信回線を利用して通信を行うマルチパス通信プロトコルの一つである MP-QUIC を採用することにより,WebRTC 通信の可用性および品質の向上を試みる.MP-QUIC は,ユーザランドで動作し低遅延なトランスポートプロトコルである QUIC を対象にマルチパス通信技術を導入しており,遠隔運転に必要な通信品質を安定的に提供できる可能性がある.評価では,WebRTC を用いた映像伝送システムに対して MP-QUIC の組み込み,市街地を走行する自動車から複数の移動体通信回線を用いた映像メディアの伝送を実施し,遅延および映像品質の計測を行う.
著者
城後 明慈 長田 智和
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2020-IOT-51, no.7, pp.1-6, 2020-08-27

目的のサーバにアクセスするために外部からサーバへのアクセスへは踏み台サーバからのアクセスが必要である.踏み台サーバでは外部から第三者に乗っ取られることや不特定多数の攻撃の中継地点を防止するためのものである.しかし,利用している踏み台サーバが停止すると学内での復旧作業が必要になってしまうそこで,新規踏み台サーバとして sshr を提案する.sshr は鶴田博文氏が作成したものである.sshr はシステム管理者が組み込み可能なフック関数を用いてシステム変化に追従できる ssh プロキシサーバである.本稿では sshr を改良し弊学へ利用できるように実装をした.
著者
石原 知洋 北口 善明 阿部 博 金子 直矢
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2022-IOT-56, no.19, pp.1-7, 2022-02-28

近年の大学授業において,対面およびオンラインの両方のタイプの授業が混在して実施される状況が増加している.そのような場合,学生が大学でオンライン講義を受講する状況も生まれるため,大学の無線 LAN インフラは多人数でのオンライン講義の受講が可能であることが求められている.安定的な無線 LAN の提供のためには無線 LAN 環境の測定・監視が不可欠であるが,従来のような帯域測定や機器監視では中程度の帯域が連続的に発生する配信講義の品質を評価することが困難である.そこで本報告では,オンライン講義の受講品質に特化した無線 LAN 環境の測定について述べる.オンライン配信に採用されることが多い WebRTC を用いて,大規模かつ断続的に送受信試験を実施しつつ,クライアント側でアプリケーションレイヤでの品質測定をおこなうことで,従来の測定では追いきれなかった無線 LAN 環境におけるオンライン配信品質の評価および監視を実施した.
著者
柏崎 礼生 坂根 栄作 込山 悠介 宮崎 純 中沢 実 岡部 寿男
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2020-IOT-49, no.7, pp.1-8, 2020-05-07

新型コロナウイルス感染症 (COVID-19) の日本国内での蔓延に伴い,2020 年 2 月中旬以降に開催が予定されていた大規模な集客を見込むイベントは中止,延期を余儀なくされた.学術においても状況は同様であり,日本国内においては特に卒論・修論発表会の終わった 2 月中旬から 3 月下旬まで学会・研究会が集中して開催される時期である.本稿では 3 月上旬に開催された,参加人数が例年 500 人を超える規模のイベントがどのようにオンライン開催の意思決定を行い,そのための準備を進め,運用を行ったのか情報共有を行い,同様の有事が発生する未来に対する議論と提言を行う.
著者
松本 亮介 中田 裕貴 栗林 健太郎
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2018-IOT-42, no.1, pp.1-8, 2018-06-21

スマートフォンや PC のモバイル化,SNS の爆発的普及に伴い,個人の Web サイトであってもコンテンツ次第でアクセスが集中する機会が増大してきている.我々は,サービス利用者に専門的な知識を要求せず,アクセス数や負荷に応じて反応的かつ高速にリソースをインスタンスに再割当てすることで,サービス利用者や事業者に手間を強いることなく突発的なアクセス集中に耐えうる FastContainer アーキテクチャを提案した.一方で,従来のホスティングサービスやクラウドサービスと同様に,インスタンスの収容サーバ障害時に,HTTP タイムアウトが生じない程度での可用性を担保しサービスを継続提供するためには,複数収容サーバに横断して,それぞれ複数インスタンスを立ち上げておく必要があった.そのため,利用者にとってはサービス利用コストの増加に繋がっていた.本研究では,HTTP リクエスト処理時において,単一のインスタンスであっても,収容サーバの状態に応じて自動的にインスタンスを別の収容サーバに再配置しサービスを継続させる,HTTP リクエスト単位での低コストで高速なインスタンススケジューリング手法を提案する.高速にインスタンスを再配置するために,Web サーバソフトウェア自体を拡張することなく,Web サーバプロセス起動時に実行されるシステムコールを監視して,起動完了する直前のシステムコール実行前の段階でプロセスイメージを作成しておくことにより,インスタンス再配置時には高速に Web サーバプロセスをそのイメージから起動させる.
著者
森 真誠 深井 貴明 山本 啓二 広渕 崇宏 朝香 卓也
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2022-IOT-59, no.7, pp.1-8, 2022-09-06

近年,爆発的に増加するデータを処理するために,多くのソフトウェアが利用されている.これらを共用 HPC システム上で利用する需要はあるものの,現在の共用 HPC システムはユーザが管理者権限を使用 (以後,root 化) できず,これらソフトウェアの導入に多くの労力を要する.また,システムレベルの最適化も root 化ができないため共用 HPC 環境では困難である.一方で共用 HPC 環境で単に root 化を許可すると,ハードウェアへの恒久的な変更などセキュリティや運用上で問題ある操作を防げない.また,ユーザのジョブがシステムの設定を変更できるため,ジョブの実行毎に設定変更の影響を取り除くためのマシン再起動が必要となるものの,再起動処理には多くの時間を要する.仮想計算機を用いるとこれらを解決できるものの,仮想化処理による性能劣化があり HPC システムには適さない.本研究では,上記課題を解決しユーザの root 化を可能とするシステムを提案する.提案システムは軽量なハイパバイザによって (1) ハードウェアの恒久的な変更を防ぐ機能と (2) ジョブ実行後マシンの再起動なしにシステムを既定の状態へ戻す機能を提供する.本手法を富岳と同系統システムで評価するため,Arm プロセッサで動作する軽量ハイパバイザ MilvusVisor と上記 2 つの機能を設計および実装した.本実装による実験の結果,メモリ性能における性能劣化について 2% 以下で上記機能を実現できることを確認した.
著者
野村 孔命 力武 健次 松本 亮介
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2018-IOT-41, no.24, pp.1-6, 2018-05-10

データベースの情報を利用して動作する Web アプリケーションでは,入力検証やクエリ発行処理の脆弱性により,開発者の想定していない不正クエリがデータベースに発行され機密情報を窃取される攻撃が発生する.このような攻撃に対して,Web アプリケーションがデータベースに発行するクエリのホワイトリストを作成し不正クエリの検知を行う方法がとられてきたが,Web アプリケーションの大規模化や実装言語の多様化に伴いホワイトリストの作成が難しくなっている.そのため,Web アプリケーション解析や運用時のクエリを用いた学習により生成を用いてホワイトリスト作り,検知する手法が提案されている.しかし,手法が実装言語依存の問題や Web アプリケーションの仕様変更の頻度が高いことによるホワイトリストの管理が難しい問題がある.本稿では,Web アプリケーションの動作を保証するためのテストがあり,Web アプリケーションの更新に追従してテストの更新が行われる開発プロセスが採用されていることを前提とし,テスト時に発行されるクエリからホワイトリストを自動作成する手法を提案する.Web アプリケーションの運用時には作成されたホワイトリストを用いて不正クエリを検知する.提案手法は,Web アプリケーションの複雑性や実装言語に依存せずにクエリのホワイトリストを自動作成することができ,新クエリが実装された場合もテストの更新に伴いホワイトリストが更新される.また,検知されたクエリはテストされていないクエリもしくは不正クエリであり,これらを早期に発見することで原因となる Web アプリケーションの脆弱性が長期化することを防ぐことができる.
著者
財津 大夏 三宅 悠介 松本 亮介
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2018-IOT-41, no.4, pp.1-8, 2018-05-10

日本ホビー協会によると,ハンドメイド作品を対象とした EC サイトの流通は年間 177 億円が見込まれている.ハンドメイド作品はその希少性や独創性が価値の一端を担っているが,市場の拡大に伴い,これらの性質を満たさない大量生産品の出品が問題となっている.大量生産品の増加は,ハンドメイド作品を期待する購入者の EC サイトへの不信感や流通低下に繋がり,長期的には市場の衰退を招きかねない.このためハンドメイド作品を対象とした EC サイトでは,大量生産品の削除や出品者のアカウント停止などの対応が行われるが,全商品の目視確認は困難であるため,大量生産品を自動的かつ継続的に検出する仕組みが必要である.本報告ではこの課題を解決するため,商品の削除やアカウント停止を回避する振る舞いを出品者の異常な振る舞いとして検出する手法を提案する.大量生産品の出品者は,アカウント停止を回避するために多数のアカウントを作成し,アカウント名に無意味な文字列を設定する傾向がある.また,商品の削除に備えて出品数を増やすために国外 EC サイトの商品を翻訳しており,商品説明文などの日本語が不自然であるという特徴がある.これらの特徴を異常と定義し,単純ベイズ分類器で分類することで大量生産品を検出する.本報告では実際のハンドメイド作品を対象とした EC サイトのプロダクション環境のデータに対して提案手法を適用し,検出率を計測して有効性を検証した.
著者
高名 典雅 柏崎 礼生
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2021-IOT-52, no.13, pp.1-5, 2021-02-22

COVID-19 によりインターネットを利用したテレビ会議やビデオ通話の利用が急増した.機密性の高い情報を扱うテレビ会議や,プライバシーを確保したいビデオ通話を実現しようとすると空間などの物理的な制約条件のため自由な利用が困難である.本稿では安価で可搬性があり,高い機密性を実現することのできる占有型情報環境の提案を行う.筆者らは NICT の若手セキュリティイノベーター育成プログラム「SecHack365」においてセキュアな入出力装置を開発した.これを改良し,また伝統的な日本文化との融合することより,十分な稼働時間,身体に負担をかけない軽量,および財布に負担をかけない価格を実現できることを定量的に評価した.
著者
田中 啓介 東 結香 上原 哲太郎
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2020-IOT-50, no.4, pp.1-6, 2020-07-03

本研究では,セキュリティ対策に十分な費用を割くことが難しい組織が,効果的な対策を選定できることを目的とし,各種セキュリティガイドライン内で提言されている対策項目が,実際に発生したセキュリティインシデントの事例で有効であるかどうかの評価を行った.評価は,当該対策が施されていればセキュリティインシデント発生を防げていたかどうか,及び当該対策を施す難易度を踏まえて実施した.
著者
三宅 悠介 松本 亮介
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2018-IOT-42, no.2, pp.1-7, 2018-06-21

EC サイトの商品種類増大に伴う情報過多問題を解決するため,利用者の要求を満たす商品を自動的に提案する機能が EC サイトにとっての関心事となる.大規模 EC サイトで商品を提案するために扱う特徴量は大規模かつ高次元ベクトルの集合となるため,類似度の比較は精度と計算量を抑えた近似解を用いなければならない.商品を自動的に提案する機能には,可用性を担保しつつ,提案内容の的確さと充分な応答速度が求められる.本報告では,大規模 EC サイトで商品を提案することを想定して,精度と速度を両立した分散可能な近似近傍探索エンジン Sanny を提案する.Sanny は,検索質問データ (クエリ) に対する高次元ベクトル集合の近傍探索結果の上位集合が,クエリと高次元ベクトル集合を任意の次元数で等分した部分ベクトル単位で近傍探索した結果と類似しやすいことに着目して,提案すべき商品の近傍探索を部分ベクトル単位での探索に分解することで分散処理可能にし,その探索結果の和集合である近傍候補から再度近傍探索を行うことにより,全体として高速に近似近傍探索を行える.実験では,従来の近似近傍探索に対する速度並びに精度面での性能比較について評価を行う.