著者
吉井 伸一郎 河内 佑美 吉村 真弥
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.109, no.293, pp.55-60, 2009-11-12

一見ランダムなデータセットの中にも,ある普遍的な特徴が潜む,複雑なシステムが自然界には多数散見されている.何らかのフィードバックループを伴うことにより自己組織化するプロセスは,構成要素の詳細に関わらず生じうる.特に,ネット空間においては,膨大なインタラクションから集合知と呼ばれる創発的なインテリジェンスが形成される事例が数多く知られている.本報告では,こうしたユーザインタラクションを活用した"crowd computing"型のシステムアーキテクチャーについて解説し,実際に,レコメンデーションと呼ばれる商品・情報の推薦サービスへの応用事例を示す.1年半に及ぶ長期運用結果をもとに,著者らが開発した複雑ネットワークのコミュニティ分割手法によるアプローチが優れた特性を有することを示す.
著者
松本 知弥子 馬 強 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.101, no.192, pp.105-112, 2001-07-11

WWWの急激な進歩と普及によって, 多くの一般のユーザが多種多様な情報を受信・発信できるようになり, 情報資源の量は, 日々増加し続けている.ユーザが大量の情報の中から, 情報を検索することは非常に困難な作業である.特に, 地域密着情報のようなローカル的な情報を獲得するには, 従来の検索やフィルタリング手法は不十分である.本稿では, Webページのローカル度という新しい尺度を定義し, それに基づくフィルタリング手法を提案する.ローカル度の定義方法として, 1文書内のローカルさを特徴付ける地理用語や組織名の頻度・詳細度・位置情報と, 他のページとの関係からリンク構造解析や類似しているページの数を用いる.また, ローカル度の定義を評価するための予備実験の結果を示す.
著者
佐々木 祥 宮田 高道 稲積 泰宏 小林 亜樹 酒井 善則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.150, pp.67-72, 2006-07-07
被引用文献数
2

近年急速に普及しているsocial bookmarkは,これまで利用者が個別に管理していたbookmarkをネットワーク上で他の利用者と共有するサービスである.これらのサービスでは多くの場合,利用者がbookmarkに対して「タグ」と呼ばれる自由記述のキーワードを付与することによって管理を行うFolksonomyと呼ばれる分類法を採用している.このようにして利用者が付与したタグ情報の集合は,多数の利用者によって成長を続けるメタデータであるとみなせるため,このタグ情報を利用することにより効率的なコンテンツの検索や推薦を行うことができると考えられる.しかしながら,利用者はあくまで自分自身の嗜好に基づいてタグ付けを行っているため,分類に使用したタグ名そのものは,必ずしも他の利用者とって適切なものであるとは限らない.そこで本研究では,タグの持つ本質的な情報を,タグ名ではなく,タグによるコンテンツの分類情報であると仮定し,分類間の類似度に基づいて利用者に対して望ましいコンテンツの推薦を行うシステムを提案する.
著者
野沢 健人 中岡 義貴 山本 修平 佐藤 哲司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.114, no.204, pp.41-46, 2014-09-03

近年,レシピ投稿検索サイトに大量の料理レシピが投稿されている.これらのレシピの中には,一部の食材を入れ替えた類似レシピが数多くある.本研究では,大量のレシピデータの中から,特定の食材に対する代替可能な食材を発見する手法を提案する.調理手順中に記述された食材と調理法を特徴に,ニューラルネットワークに基づく言語モデルとして知られるword2vecを用いて,特定の食材に対して他の食材の類似度を算出することにより,代替可能な食材を発見する.数十万件のレシピデータを用いて評価した結果,提案法の有効性を確認したので報告する.
著者
大平 哲也 服部 司 佐藤 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.109, no.293, pp.9-14, 2009-11-12

サイバーエージェントが展開する「Ameba」は650万人の会員ユーザーを集めるブログを中心とした国内最大規模のインターネットサービスであるが、ユーザー数に比例して日々蓄積されるデータがブログ記事のテキストデータで30GB/月(2009/10月現在)を超える膨大なものになっている一方、社内でのデータ解析やその再利用が遅れていた。対策の一環として、2009年1月に研究開発を行う組織(インキュベーションラボラトリー)を新設し、社内に蓄えられた膨大なデータの解析と、解析結果を基にしたコンセプトアプリの開発ならびに現場への応用を進めている。その一例として、ブログサービス内でのトレンドワードの解析を実施している「Keyword Tracker」と、汎用的なspamフィルタリングプラットフォームとして構築を進めている「spamフィルターAPI」について、採用している技術的なアプローチの紹介とデータを解析してみて得られた結果ならびに知見の報告を行う。
著者
藤本 典幸 萩原 兼一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.173, pp.61-66, 2005-07-08
被引用文献数
3

個人ユーザを対象に, 数Mbps程度のインターネット回線1本とコモディティPC1台のみを用いて, ウェブページ上に掲載されているマルチメディアデータをキーワード検索するシステムの設計と実装, および評価結果について述べる.サポートされるデータ形式は, 画像(JPEG, GIF, PNG), 動画(MPEG, FLASH, RealMediaなど), 音声(MP3, wave, MIDIなど), PDFファイルなど, HTMLのIMGタグ, Aタグ, OBJECTタグ, EMBEDタグで記述できるもの全てである.本システムはユーザがクエリーと収集時間を入力した後に, Google Web APIを用いて取得したウェブページ群を種ページとして, 指定された時間の間, トピック主導型クローリングを行い, 収集したHTMLのテキストベースの解析を行う(マルチメディアデータの内容解析は行わない).クローリングアルゴリズム, スコアリングアルゴリズムを工夫し, マルチスレッドプログラミングを行うことにより, 本システムは, 各ウェブサイトにかかる負荷を考慮しつつ, ユーザのクエリー入力後30秒間で150ページ前後のウェブページをクローリング, 解析し, 300個程度のマルティメディアデータ(多くは画像)をスコア順に出力することができる.
著者
有澤 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.117, pp.29-34, 2005-06-10
参考文献数
10
被引用文献数
4

現在医学界では、全身PET(Positron Emission Tomography陽電子放射断層撮像)画像診断が、非常に有効なガン診断法として新たに注目されている。このPET診断を集団検診で用いたいというニーズも発生しているが、医師の負担が大きい、専門医の不足などの問題がある。これらの問題を解決するために情報科学的な手法を駆使した精度の高いPET自動診断システムが求められている。本研究では、そのひとつの解として医師の診断を模倣したPET自動診断システムを提案し、その実用性について検証を行う。
著者
大村 政博 角所 考 岡留 剛
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.113, no.105, pp.17-22, 2013-06-15
被引用文献数
1

実世界での動向を「リアルタイム」に捉えることを目的として,感情表現に関係した形容詞を含むtweetsを時間単位で区切り,それを1つの文書とみなして,Latent Dirichlet Allocation (LDA)により,社会的感情を分析する手法を提案する.その手法では,常識的な社会的感情のほか,直感的には意味が不明確な「感情」も取り出される.ただし,抽出された社会的感情の日々の変動に対する感度が低い.この低感度性を回避すべく,多数の形容詞を代表的少数の形容詞に縮約し,それ以外の語を除いて縮約された形容詞を残して「文書」としLDAを適用する手法を提案する.その手法により抽出される社会的感情の時間的変動に対する感度は縮約なしの分析により抽出される感情よりも高く,社会的感情を入力とする入力つきARモデルによるDJIA(ダウ平均株価)の予測は,通常のARIMAモデルによる予測よりも平均予測誤差が小さい.
著者
水野 聖也 大澤 純 原 隆浩 西尾 章治郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.114, no.101, pp.33-38, 2014-06-14

近年,パーソナライズされた情報推薦の技術が普及しており,それに伴って,嗜好抽出の重要性が高まっている.本稿では,ユーザがスマートデバイスにインストールしているアプリケーションを基に,嗜好抽出を行う手法を提案する.この手法では,マーケット上に記載されているアプリケーションの説明文からキーワードを抽出し,各キーワードを,キーワードの特徴度,アプリケーションの固有度,アプリケーションの1日の平均利用時間に基づいた3つ指標を用いてスコアリングを行うことにより,キーワードとその重要度を表すスコアの形式でユーザの嗜好を表現する.被験者実験の結果,保有アプリケーションが嗜好抽出の情報源として有用であることが確認された.また,結果をもとに各スコアリング指標の特性の検証を行ったところ,保有アプリケーション数が十分多いユーザに対して,アプリケーションの固有度に基づくスコアが有効である傾向が見られた.また,端末の利用時間の長いユーザに対して,アプリケーションの利用時間に基づくスコアの有効性が示唆された.
著者
野沢 健人 中岡 義貴 山本 修平 佐藤 哲司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.114, no.204, pp.41-46, 2014-09-03

近年,レシピ投稿検索サイトに大量の料理レシピが投稿されている.これらのレシピの中には,一部の食材を入れ替えた類似レシピが数多くある.本研究では,大量のレシピデータの中から,特定の食材に対する代替可能な食材を発見する手法を提案する.調理手順中に記述された食材と調理法を特徴に,ニューラルネットワークに基づく言語モデルとして知られるword2vecを用いて,特定の食材に対して他の食材の類似度を算出することにより,代替可能な食材を発見する.数十万件のレシピデータを用いて評価した結果,提案法の有効性を確認したので報告する.
著者
菅野 憲明 佐々木 雄大 高山 毅 池田 哲夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.177, pp.207-212, 2004-07-07

コンビニエンス・ストア(通称「コンビニ」)における新商品の売れ行き予測に関する学術的な検討が遅れている.著者らはこれまでに,市販のPOSデータを用いて「おにぎり」と「カップラーメン」の新商品の売れ行き予測に関する予備的な検討として,特定店舗で成立する相関ルールの抽出を行なった,本稿では,店舗を問わず成立する一般的知見の導出を目指す.具体的には,コンビニ会社A社へのヒアリングを通じて,新商品投入後二週目の売れ行き予測に対するニーズがあることを述べる.そして,これを目的変数とした場合の説明変数として有効な変数を,A社の協力の下,データマイニングにより導出する,これらの説明変数と目的変数を用いて,店舗ごとにルール抽出を行なうと有効なルールが得られることが確認された.
著者
奥山 拓矢 土屋 達弘 菊野 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.337, pp.7-12, 2005-10-10

ゴシップアルゴリズムは, P2Pオーバーレイネットワークで用いられる, 高信頼性, 且つスケーラブルなブロードキャスト手法である.本研究では, P2Pオーバーレイネットワークの代表的なトポロジーとして, スケールフリーネットワークに着目し, そのネットワークトポロジーでの, ゴシップの耐故障性を向上を目的とする.先ず, 各ノードがその周囲のノードのメッセージ伝搬状況を推測し, 状況が悪い場合にメッセージの再送を行う手法を提案する.さらに, スケールフリーネットワークで優れた通信コスト効率が確認されている決定性ゴシッププロトコルと, 提案手法を組み合わせる事でコスト効率と耐故障性の両面に優れたプロトコルを提案する.スケールフリーネットワークのモデルを用いて, 提案するプロトコルと従来プロトコルの比較実験を行い, その結果を示す.
著者
田中 浩也 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.103, no.191, pp.169-174, 2003-07-10

デジタルスチルカメラや携帯電話内蔵型カメラの普及に伴い,多くのユーザが写真画像を大量に撮影し保存するようになった.そのため蓄積された写真画像を高度利用するためのさまざまシステムが検討されている.筆者らは,近い位置で撮影した写真画像をリンクで互いに繋ぎ合わせる方法に基づく「ハイパーフォト空間」の提案を行ってきた.ハイパーフォト空間は,写真を空間的にリンクで結びつけるだけの比較的簡易な機構であるが,ユーザが短時間で擬似3次元空間を制作できる点が特徴である.ハイパーフォト空間はまた,個々のユーザが「写真」と「リンク]を用いて,現実のある空間を再構造化した結果と見なすことができる.そのため制作されたハイパーフォト空間を分析することで,ユーザの主観的な解釈を経た現実空間の状態を把握し,建築や都市分析に応用することが可能と考えられる.そのような展望に基づき,本稿では幾何構造に基づいてハイパーフォト空間の特徴を抽出する方法をまとめ,それらの手法を用いたハイパーフォト空間分析の基礎的な実験結果を示す.
著者
石田 渉 横山 大作 中野 美由紀 豊田 正史 喜連川 優
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.112, no.172, pp.35-40, 2012-07-25

近年のクラウドコンピューティングでは,計算資源の管理に仮想化技術を利用している.仮想化技術の要素技術の一つであるVMライブマイグレーション等を利用することで,クラウドプロバイダではサービスを停止することなく計算資源の集約化や負荷分散が可能となる.現在,ウェブコンテンツ,センシングデータなどのデジタルデータが急増するなか,クラウドコンピューティングにおける大容量のデータを処理するアプリケーションの効率化が急務である.しかしながら,大規模I/O処理を行うVMライブマイグレーションの挙動は十分に解析されていない.本報告では,VMライブマイグレーション時の入出力挙動を実機を用いて詳細に解析し,大規模データ処理におけるVMライブマイグレーションにおける課題について明らかにする.
著者
石川 佳治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.290, pp.37-42, 2006-10-10

本稿では,大量の移動オブジェクトの移動軌跡をクラスタリングし要約するための新たなアプローチを提案する.これまで,移動軌跡のクラスタリングに対していくつかの提案が見られるが,移動軌跡間の距離を定義することによりクラスタリングするアプローチが主流であった.しかし,それらの提案では,移動パターンの分布などを直接的には考慮しないため,移動パターンの全体的な特徴が必ずしも表現されないという問題点がある.提案手法では,移動パターンをマルコフ連鎖モデルによりモデル化し,情報ボトルネック法を拡張した情報理論的クラスタリングを行う.情報ボトルネック法では,情報量の減少が少ないような(すなわち,あいまい性の増加の程度が小さいような)クラスタリングを求めることを目的とする.このような考え方を,複数の移動軌跡の要約によるあいまい性の増加と関連づける.本稿ではその基本的な考え方について説明する.
著者
柳瀬 康二 高橋 洋一 柳内 進吾
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.109, no.293, pp.15-18, 2009-11-12

インメモリ処理技術を中心に置いて開発されたデータウェアハウス用DBエンジン「EXASOL(エクサソル)」には、クラスタリング、列ベースのデータ格納、データ圧縮、自動インデクス作成機能などのアーキテクチャも採用されている。これらの技術により、EXASOLはTPC-Hのデータ量で区分されたいくつかのカテゴリにおいて第1位のパフォーマンスをマークした。本稿では、データベースの性能向上に寄与する高速化技術に加え、構築・運用の容易性、および高可用性のためのフェールオーバー機能についても言及する。
著者
嶋 陽一 大本 英徹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日
vol.96, no.176, pp.165-170, 1996-07-25

インターネットやイントラネットの普及により,WWWを用いて大量の文書データベースをハイバーメディア構造によって提供する事例が増えてきている.しかし,大規模になると一貫性を保ちつつこれを人手によって管理することは非常に困維となる.本論文では,オブジェクト指向データベースにおける経路存在従属性(PED: Path Existence Dependency)をリンクの一貫性に応用して,ある制約を与えてそれを満たすかどうかの検査を行ない,文書データベースにおけるリンクの参照一貫性を保つことに関して議論し.リンクの一貫性管理を考感したハイパーメデイアデータベースモデルについて述べる.
著者
岩田 具治 斉藤 和巳 山田 武士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.107, no.114, pp.57-62, 2007-06-21

オンラインストアの収益を向上させるためには,顧客生涯価値(LTV)を高めることが重要である.従来のリコメンデーション法はユーザの興味と最も適合する商品を推薦する.しかしながら,従来法により必ずしもLTVが高まるとは限らない.本研究では,LTVが上昇する確率を最大化する新たなリコメンデーション法を提案する.提案法では,まずLTVの高いユーザに特徴的な購買パターンを抽出する.そして,抽出されたパターンと同じような購買行動になるように商品を推薦する.生存時間解析を応用し,ログデータから効率的に購買パターンの抽出を行う.また,効果的なリコメンデーションにするため,最大エントロピーモデルを用いてユーザの嗜好を推定する.LTVが高まることはユーザがサービスに満足した結果であるため,提案法はオンラインストアだけでなく,ユーザにとっても好ましいリコメンデーションである.音楽配信サイトの実ログデータを用い,提案法の有効性を示す.
著者
満月 賢治 伊藤 秀隆 隅元 昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日
vol.98, no.486, pp.57-63, 1998-12-17
参考文献数
10

近年, インターネットの急速な発展により, 遠隔地間の多様で情報通信が実現しつつある.その応用形態として, 教育利用への活用の試みも報告されている.ここで重要な問題として考えられるのは, 受講者が多人数にわたる場合に, 受講者の発信する大量の回答や質問などの情報を, いかに確実かつ効率よくUp Streamの流れとして確保するか, である.そこで, 本研究では, WWWを用いた遠隔教育システムにおいて, 地域的に分散している多人数の受講者から発生する大量のUp Stream フィードバックデータを確保するための分散処理システムの構築を目的としている.
著者
中岡 美華 手塚 太郎 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.149, pp.47-52, 2006-07-06
参考文献数
9

近年,たくさんの小学校で,幼少者みずからが自らの判断でWorld Wide Webの情報を収集し,利活用する授業が始まった.これまでの情報検索システムでは,利用可能な情報を検索できるキーワードを注意深く選別しなければならず,負荷が高い.幼少者は,抽象化の概念が未発達なため,適切なキーワードを想起すること,また,検索したいものを明確に定義する事が難しい.それゆえに,たくさんの意図しない検索結果が出現する.これらの改善を目指すため,我々は,幼少者がやさしくWorld Wide Webにアクセスし情報を検索できるような手法を開発すること,それにより現在の小学校における総合的な学習の時間で設けられている「調べ学習」が,さらに効果的になるための支援が実現することを目的とし,幼少者の行動特性や思考特性を考慮する方法でWorld Wide Webにアクセスし情報を検索できるような,3次元型ブラウザを開発した.このブラウザは,難解なWorld Wide Web上のページ構造を自動的に3次元空間にレンダリングし,その3次元空間をゲーム感覚で走り抜けるといった負荷の少ない感覚で利用することを実現した.このブラウザの利用により,幼少者はWorld Wide Web上のページ構造を体感的に習得しながら,自らの課題を発見することができる.