著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.Research is being conducted on technology to get users' reactions to specific topics in microblogs. It is necessary to know the users' characteristics in order to effectively utilize microblogs as social sensors. However, it cannot understand the users' characteristics, because user attributes are not often to the public in microblogs. For this reason, research on estimating user attributes in microblogs has been drawing attention. However, existing methods, which merely focus on the description contents in microblogs, do not take advantage of the characteristics in microblogs that transmit in real time to estimate users' attributes. This research proposes a method for classifying the users according to number of posts per unit time and estimating the occupation attributes by description contents, lifestyle and time zone of posts. Our demonstration experiments verify usability of the proposed method by comparing the existing methods of estimating merely using description contents with the proposed method of estimating using description contents and temporal characteristics.
著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.
著者
大島 裕明 小山 聡 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.47, no.19, pp.98-112, 2006-12-15
被引用文献数
15 or 0

本研究では,ユーザが与えた1語のクエリに対して,Web検索エンジンが持つ情報のみから同位語とそのコンテキストを発見する手法について提案する.同位語とは,共通の上位語を持つような語のことである.従来研究として,同位語や,上位語,下位語などを求めるような研究は数多くあるが,それらはWeb上の文書を利用するものも含めて,巨大なコーパスを解析して大量の結果を求めるというものであった.我々の提案する手法では,Web文書のタイトルやスニペットといったWeb検索エンジンが持つ情報のみを,少ない回数のWeb検索によって取得し,それらを解析して同位語を発見する.提案手法では,ある語に対する同位語は並列助詞「や」で接続されることを利用してWeb検索エンジンに対するクエリを作成して,その検索結果のみから同位語を得る.そこでは何の事前準備も必要なく,また,あらゆる分野の語に対して同位語を発見することができる.さらに,発見された同位語とクエリの語の背後にあるコンテキストも同時に取得する.このような同位語発見は,Web検索におけるクエリ拡張や想起支援や,何かを調べるにあたって他のものと比較したいときの比較対象の発見など,幅広い分野で利用することができると考えられる.We propose a method of using only a Web search engine index to discover coordinate terms, i.e., terms that have the same hypernym. Several research methods acquire coordinate terms, but they require huge corpora or many Web pages. Our proposed method uses only the information in a Web search engine index such as titles and snippets of Web pages. These are obtained by a few Web searches, and then they are parsed to discover coordinate terms. We focus attention on coordinate terms that are connected by the coordinating particle "ya," and use those to make queries for a Web search engine. Our method does not require any preprocessing, and can find coordinate terms for terms in any field. At the same time, we find the background context between a query term and each discovered coordinate term. Such a service for discovering coordinate terms can be used in any field for such purposes as query expansion, word remembrance support system, or finding comparable objects.
著者
佐々木 祥 宮田 高道 稲積 泰宏 小林 亜樹 酒井 善則
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.20, pp.14-27, 2007-12-15
被引用文献数
4 or 0

近年急速に普及しているソーシャルブックマークは,ユーザ間でブックマークを共有できるサービスであり,新たな情報収集ツールとして注目されている.ソーシャルブックマークでは,ユーザはwebコンテンツにタグと呼ばれる自由記述のキーワードを付与できるため,既存研究においてタグの名称に着目したwebコンテンツ推薦システムが提案されている.しかしながら,ユーザの嗜好はタグの名称ではなく,タグを表象として関連付けられたwebコンテンツ群(以下,コンテンツクラスタ)として表出するものといえる.そこで本研究では,コンテンツクラスタ間の類似度を仮説検定問題として求め,得られた類似度に基づくwebコンテンツ推薦システムを提案する.また,提案手法の検証実験によって,付与するタグの名称が他のユーザと異なるユーザに対しても有効に推薦することが可能であるなどの有効性を確認することができた.The web-based bookmark management service called social bookmark has recently been in the spotlight and come to be recognized as a new information sharing tool.Social bookmark service allow users to tag keywords to each of their entries. These keywords are called 'tags'. There are some conventional studies of the web content recommendation system based on social bookmark which is focused to actual words of tags. However, the essential information of tags is not tag names, but classification of web contents by tags (we called the result of this classifications as contents cluster). Based on this assumption, we calculate similarities between contents clusters by using hypotheses test. By using calculated similarities, we proposed the web content recommendation system based on these similarities. It has been shown that our proposed method is working well, as the fact that appropriate recommendation can be offered to users, including who tagged different named tags to the same contents.
著者
田中 成典 中村 健二 寺口 敏生 中本 聖也 加藤 諒
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.3, pp.73-89, 2013-06-28

携帯端末の普及にともない,ユーザの状況に応じて様々な情報をリアルタイムに提供するサービスに注目が集まっている.そのため,GPSから取得した位置情報や,マイクロブログの投稿内容からユーザの行動を推定する研究が行われている.著者らは,これらに加えて,新たにユーザの習慣的な行動に着目した推定手法について検討を行った.本研究では,マイクロブログにおけるユーザの投稿内容と投稿数の変化から行動のパターンを抽出し,指定した時間帯における習慣的な行動を推定する手法を提案する.この手法により,マイクロブログの投稿内容には行動に関する記述がない場合でも,指定した時間帯におけるユーザの行動を推定できる.実証実験では,投稿内容のみを用いた手法と習慣行動もあわせて考慮する本手法とを比較し,提案手法の有用性について検証した.Services to provide variety of information in real time with reference to users' situations are receiving attention, as portable terminals have become widespread. Accordingly, some studies are being made to estimate the users' activities from their location information obtained by GPS or from the contents of their microblog posts. In addition to these, the author and his colleagues examined a new estimation approach focused on the habitual behavior of users. The present study proposes an estimation method of users' habitual behavior within designated periods of time by extracting behavioral patterns from the changes in contents and numbers of their posts in microblogs. This method enables estimation of users' behavior within designated time periods without any behavioral description provided in their microblog posts. Our demonstration experiments compare a method of merely using posted contents with this method that also considers habitual behavior as well, and verify its usability.
著者
野沢 健人 若林 啓
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.2, pp.1-10, 2016-06-29

グラフ構造におけるコミュニティ発見手法は,ソーシャルメディアや共著関係,商品の購買データなどから機能的・構造的にまとまりをもったノード群を抽出し分析することを可能にする重要な技術である.特に近年では,非常に大規模なグラフを解析する機会が多くなってきているため,グラフの規模に対してスケーラブルなコミュニティ発見手法が求められている.本研究では,あるノードからの距離が一定以下のノードの集合を文書と見なしてトピックモデルを学習し,トピックごとのノードの予測分布を用いてコミュニティ発見を行う手法について論じたうえで,トピックモデルの学習に確率的変分ベイズ法を適用することで,データの規模に対して高いスケーラビリティを持つ重複コミュニティ発見手法を提案する.実験により,提案手法は6,000万ノード,18億エッジからなる大規模ネットワークに対しても,既存手法と比較して高速なコミュニティ発見を実現できることを示す.
著者
片岡 良治 遠藤 斉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.41, no.3, pp.37-45, 2000-05-15
参考文献数
11
被引用文献数
8 or 0

本論文では,MPEG符号化情報から直接的に求められる映像の特徴情報を用いて,映像に含まれる類似シーンを精度良く検出する方式について述べる.ここでいう類似シーンとは,例えば野球中継の映像に含まれる個々のホームランシーンのように,理論的に同じ意味を持つが物理的な構成が異なるシーンを指す.類似シーンを精度良く検出できれば,それらに一括して同じタグ情報を付与できるようになり,映像データベースのインデクシング作業の効率化が図れる.提案法は,特にスポーツ映像へのタグ付け処理の効率化を狙いとしており,スポーツ映像の類似シーン共通するカメラワークの存在に着目してシーン検出を行う.また,音声認識の分野で提案された連続DPマッチングをカメラワーク情報の照合処理に適用することで,類似シーン毎のシーン長の違いに柔軟に対応する.実際の野球中継の映像を用いて実験した結果,提案法は従来法よりも高い適合率と再現率を提供できることが明らかとなった.This paper describes a similar detection method using feature information directly obtained from MPEG encoded video data. Scenes are regarded as similar ones when they have the same logical meaning while each of them conteins sifferent physical data. For instance, all home run scenes in a baseball program have the same logical meaning of "home run"while each of them contains different image data. Similar scene detection is effective for eliminating trouble in making an index of a video databese since it makes it possible to assign the same keyword to all derected scenes at once. The proposed method derects similar scenes based on their camera work similarity. Its main application is sports scene detection since similar sports scenes are generelly captured with the same camera work. To cope with the difference of scene length among similar scence, it adopts the continuous DP matching algorithm to compare camera work features obtained from MPEG encoded video data. It is evaluated using a broadcastung baseball prigram. The results show that it can provide higher precision and recall rates than traditional methods.
著者
森國 泰平 吉田 光男 岡部 正幸 梅村 恭司
出版者
情報処理学会
雑誌
情報処理学会論文誌(トランザクション)データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.8, no.4, pp.16-26, 2015-12-28

ツイートに含まれる特徴と位置情報を対応させることで,実世界を観測するセンサとしてTwitterを活用することができる.しかし位置情報が付加されたツイートは少なく,Twitterをセンサとして活用するときの問題の1つとなる.そこで本研究では,ツイートの投稿位置を推定し,より多くのツイートに正確な位置情報を付与することを目的とする.この目的を達成するために,ツイート中のノイズとなる単語を除去するためのフィルタリング手法を提案する.また,単語の地理的分布を平滑化するためのスムージング手法も提案する.これらの提案手法が従来手法よりも有効に機能することを示し,その考察を行う.Twitter can be considered as a real-time sensor that responds to real-world events by combining the content and location information of tweets. However, a problem persists: tweets containing location information are too small. To overcome this problem, we estimate the location where a tweet was posted. Our main method involves using word filters called AF filter and TF-IAF filter that detect stop words. In addition, we propose a smoothing method called Distance smoothing for overcoming sparsity of words. We show that both our methods improve location estimation accuracy and discuss the features of the results.
著者
奥 健太 中島 伸介 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.162-176, 2007-06-15
参考文献数
24
被引用文献数
12 or 0

本論文では,ユーザの状況に応じて適切な情報を提供する状況依存型情報推薦システムのプロトタイプを提案する.膨大な情報からユーザの嗜好に合致する情報を提供する手法として,情報推薦システムに関する研究が行われているが,ユーザのそのときの状況(時間帯や天気,同伴者,予算など)に応じて変化するユーザの嗜好に対し,柔軟に対応することは容易ではない.そこで我々は,状況に応じて変化するユーザの嗜好を適切にモデル化する手法を提案した.本論文では,このモデル化手法を適用した状況依存型情報推薦システムのプロトタイプを提案し,検証実験に基づいて,提案手法の評価を行った.この中で,提案手法であるコンテクスト依存型情報フィルタリングとコンテクスト依存型協調フィルタリングの有効性や特長の違いを明らかにするとともに,対象コンテンツの特徴パラメータの最適化に関して考察した.This paper proposes a prototype of a context-aware recommendation system which provides users with contents appropriate to their contexts. There have been many studies of recommendation systems which provide users with contents suited to their preferences. However, it is not easy to adapt these recommendations to changing contexts (e.g., time of day, weather, companions and budget). Thus, we propose a method which takes into account users' preferences as well as their current context. This paper also introduces a prototype of a context-aware recommendation system using the method, and evaluates our proposed methods. In our experiments, we explore the strengths and weaknesses both Context-Aware Information Filtering and Context-Aware Collaborative Filtering. Lastly, we discuss optimization of the feature parameters of contents.
著者
平林 幹雄 江渡 浩一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.7, pp.29-37, 2007-03-15

全文検索システムの転置索引を実現するにあたり,テキストデータからN-gram法によって切り出したトークンを検索キーにする手法が広く用いられている.この手法には,言語中立性や再現率の完全性という利点がある反面,索引ファイルのサイズが肥大化して空間効率が悪化するという欠点がある.検索の際にクエリから切り出した各トークンが対象文書のテキスト内でも連接しているかどうかを判断するためには,索引ファイル内にトークンの文書内での出現位置を記録しておくことが必要となるが,この位置情報が索引ファイルの肥大化の一因となっている.本稿では,N-gram法の欠点である索引ファイルの空間効率を改善する手法として,N.M-gram法を提案する.N.M-gram法では,各トークンの文書内での位置情報のかわりに後続のトークンのハッシュ値を用いることによって,N-gram法の利点である言語中立性や再現率の完全性を保持したまま,空間効率を改善することができる.When constructing inverted index for full-text search system, using N-gram is very popular for tokenizing text data of target documents. Although the method has many advantages like language neutrality and perfect recall ratio, it has also shortage that the index file becomes large. The tokens extracted from documents tend to be enormous. The system needs to record each offset of tokens into the index file because the offset is used for checking adjacency of tokens. The index file tends to be large because of the offset. In this paper, we describe N.M-gram method, which improves space efficiency of N-gram. The method uses hash values of succeeding tokens instead of offset in each document. The method can improve space efficiency without losing advantages of N-gram.
著者
吉田 光男 荒瀬 由紀
出版者
情報処理学会
雑誌
情報処理学会論文誌(トランザクション)データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.1, pp.20-30, 2016-03-31

ソーシャルメディアでの言及量やウェブ検索エンジンでの検索頻度をもとに,トレンドキーワードを発見する研究開発が広く行われている.また,注目されているキーワードに対して情報を付与し,そのキーワードの理解を促すような試みもある.しかし,それらのトレンドキーワードが様々なウェブリソースでどのように振る舞うのかは必ずしも明らかではない.そこで本研究では,トレンドをとらえうるウェブリソースを対象に,収集したトレンドキーワードがどのように振る舞うのかを横断的に調査する.この調査により,大半のトレンドキーワードがオンライン辞書サービスに登録されていないこと,検索のトレンドは2日で50%未満の頻度に収束すること,ソーシャルメディア(Twitter)がほかのウェブリソースよりもトレンドに敏感であることなどを明らかにする.Many researchers work on studies for discovering trend keywords and queries on the web, i.e., search frequency and social media. Moreover, studies on trend query classifications are being conducted. However, the behavior of trend queries for various web resources is unclear. In this study, we investigate how trend queries appear in different resources on the web. We clarify the following. (1) Most trend queries are not registered with online dictionary services. (2) The trend converges in approximately two days. (3) Social media websites (such as Twitter) are responsive to trend queries.
著者
李 龍 若宮 翔子 角谷 和俊
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.5, no.2, pp.36-52, 2012-06-29

都市を特徴付けることは,人々が日々の生活や様々な活動の中で行っている情報処理過程の一部であり,都市での意思決定を行う際に重要となる.従来は,物理的な構造形態に基づく都市の機能や都市に対する人々の意識といった都市の外観に基づく特徴付けが行われていたが,実際に都市で生活する人々の活動を支援するためには,人々のライフスタイルを中心とした特徴付けが重要となる.都市における人々の活動は多様であり容易に把握することは困難であるが,近年のソーシャル・ネットワーク(SNS)の発達とスマートフォンの普及により,多くのユーザが実空間における活動や感情を自らの居場所の位置情報とともに自発的に発信するようになり,実世界の物理的空間と密接に関連した位置ベースSNSを通して,都市における群衆のライフスタイルを把握することが可能になっている.本研究では,位置ベースSNSに蓄積されている大量のユーザの時空間ライフログを用いて都市空間における群衆行動をモニタリングし,都市の地域特徴を抽出する手法を提案する.具体的には,Twitterに投稿されているジオタグ付きTweetsを用いてモニタリングした群衆行動をベクトル化し,地域と群衆行動特徴によって構成した行列を分析することで,特徴的な行動パターンとそれに対応する都市を抽出する手法を提案する.実験では,Twitterから取得した大量のジオタグ付きTweetsを用いて群衆行動を分析し抽出した地域特徴の意味付けを行うために,Yahoo! ロコが提供している店舗や施設のジャンルを調査した結果について示す.Characterizing urban space is critical to understand the space and conduct decision-makings in our daily urban lives and activities. Conventional methods have attempted to characterize urban space using urban functionalities based on physical configuration and people's conscious mind to the space. However, in order to support residents' activities in urban space, it is essential to extract characteristics focusing on crowd's urban lifestyles. However, it is a non-trivial work to monitor crowd activities and lifestyles in large-scale regions. In order to solve this problem, we can exploit current crowd's power on behalf of the proliferation of smartphones as well as the recent development of location-based social networks, where massive users voluntarily share their lifelogs and thoughts together with their whereabouts. Therefore, we can easily monitor crowd behavior through such location-based social networks. In this work, we propose a method to characterize urban space in terms of crowd behavior by utilizing enormous number of users' spatio-temporal lifelogs archived over social networks. Specifically, we derive latent classes of urban characteristics in terms of crowd behavioral patterns and relevant urban areas which are extracted using geo-tagged Tweets over Twitter.
著者
伊藤 雅弘 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.20, pp.39-49, 2007-12-15
被引用文献数
2 or 0

近年,知識処理の有用なコーパスとして,ユーザ同士が協調してコンテンツを編集するWeb事典である「Wikipedia」に多大な注目が集まっている.筆者らはこれまでの研究において,Wikipediaに対してリンク構造を解析することで精度の良いシソーラス辞書が構築できることを示してきた.しかし,膨大な記事数を持つWikipediaを解析するためには,高い精度を保ったままスケーラビリティのさらなる向上が技術的な課題であった.そこで,本研究ではリンクの共起性解析に着目し,スケーラビリティの高いシソーラス辞書構築手法を提案する.提案手法の性能評価のために行った実験の結果,共起性解析を用いた手法は従来手法よりも少ない計算時間で,高精度なシソーラス辞書を構築できることを確認した.さらに,共起性解析とtfidfを融合させることによって,より高い精度が実現できることを確認した.Wikipedia, a huge scale Web based encyclopedia, attracts great attention as a valuable corpus for knowledge extraction. We have already proved how effective it is to construct a Web thesaurus. However, we still need high scalability methods to analyze the huge amount of Web pages and hyper links among articles in the encyclopedias. In this paper, we propose a scalable Web thesaurus construction method from Wikipedia by using link co-occurrence. Experimental results show that the proposed method based on link co-occurrence analysis was better on scalability and accuracy than previous methods. Moreover, the method combining tfidf with link co-occurrence analysis brought higher precision.
著者
田島 敬史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.40, no.3, pp.152-170, 1999-02-15
参考文献数
54
被引用文献数
26 or 0

本論文では ここ数年行われている半構造データのためのデータモデルと操作言語に関する研究について概観し 主な研究についての比較と考察を行う. また これらの研究は従来のオブジェクト指向データベースやハイパーテキストに関する研究とも関係している. そこで これらの研究との比較も行う. これらの比較から 本論文では 半構造データのデータモデルおよび操作言語を設計する上で特に重要な点は 以下の二点であると考える. まず一点目は データモデルの設計の段階で いわゆる従来の意味での「データ」と 従来のデータモデルでのスキーマ情報にあたるデータとを 区別無く扱えるようにするのが望ましいという点である. 二点目は 操作言語は データベース中のデータ構造の一部分を抜き出す狭義の「問い合わせ」操作だけでなく データベース中のデータを再構成するような操作が表現できるべきであり そのためにはなんらかのポインタの操作のための機構が必要になるという点である. また 今後の半構造データに関する研究の展望についても簡単に述べる.In this paper, we survey, compare, and discuss the recent proposals on data models and query languages for semistructured data. These researches are also related to researches on object-oriented databases and hypertexts in the past. The comparison with those researches are also made. From those discussions, we consider that the following two points are key in the design of data models and query languages for semistructured data. First, a data model for semistructured data should model both "data" in the traditional sense and data corresponding to schema information in the traditional data model in a uniform way. Secondly, a query language for semistructured data should be able to express not only "selecting queries", which extract substructure from a database, but also "restructuring queries", which transform the structure of a database into another structure. To express restructuring query, functionalities for pointer manipulation are needed. In the last part of this paper, we also discuss a prospect on the future researches on semistructured data.
著者
橋本 隆子 白田 由香利 真野 博子 飯沢 篤志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.41, no.3, pp.71-84, 2000-05-15
被引用文献数
25 or 0

放送のデジタル化に伴い,映像情報の補足情報をインデックスとして付加し,そのインデックスを用いて映像情報を検索する方式が各種研究されている.インデックスを利用した映像情報検索方式の一つとして,ダイジェスト視聴に注目し,視聴者ごとに意味的に重要なシーンを判定してパーソナルなダイジェストを可能とするシステムを試作した.またこのダイジェスト視聴システムでは,視聴者が複合事象に対して自分の嗜好を交えた抽象度の高い用語を使って検索できるように抽象インデックスを定義できるようにした.本稿では,まずダイジェスト作成モデルを説明し,それを実現するための映像スキーマ定義言語を説明する.そして,野球番組を対象にして,視聴者の嗜好情報登録及び各種検索が可能なダイジェスト視聴システム及びその検索インタフェースの試作を行ったので,その機能についても述べる.Beyond program contents, digital data broadcasting can deliver additional data as indexes attached to the contents. Using these indexes, users can browse and retrive parts of the program. We have developed a system that can construct a digest of the program on the fly using indexes. The system can extract scenes and restructure them based on the information cbtained from indexes and users would use in describing the scenes they are looking for to those terms actually used in the program indexes. The paper firstly describes a formal model of the digest prodiction and a program schene defintiton language to implement the model. Also, we explain our prototype system of the digest viewing system with a user interface to put in user preferences and various retrieval requirements for baseball programs.
著者
秦 淑彦 廣瀬 竜男 中西 吉洋 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.42, no.4, pp.14-26, 2001-03-15
被引用文献数
4 or 0

多数のカメラで撮影され相互に時間同期した多視点映像の応用として,運動会やコンサートなどのイベントにおいてユーザが興味を抱いた被写体を,ユーザが見ているシーンと比べ``よりよく''写している映像シーンを検索することが考えられる.このような応用に対する1つの技術課題は,検索の仕方や被写体に関する十分な知識を持たない一般ユーザが,興味ある被写体を見つけ簡単に問合せを形成できる仕組みを提供することである.もう1つは,ユーザが注目した被写体を``よりよく''写す映像,たとえばズームアップした映像や反対側から撮った映像シーンを探して表示する機能の実現である.本論文ではこれらの課題に対して,カメラメタファに基づく多視点映像の問合せ検索方式を提案する.まず,我々が慣れ親しんだカメラ操作を問合せ形成のためのメタファとする検索カメラを考え,検索カメラのファインダに写る被写体を観察し,興味あるものを探して指定する.次に,興味対象を指定した際の検索カメラの撮影時刻と撮影範囲を問合せ情報として,撮影時刻と撮影範囲をメタデータとして有する多視点映像を時空間上で検索し,興味ある被写体を``よりよく''写している映像区間の集合を得る.検索結果には映像実体データ以外に被写体の写り具合を計算するための情報が含まれ,ユーザの好みに応じた映像を選択して表示する.さらに,提案方式をプロトタイプとして実装し,時空間検索アルゴリズムに対する実験評価を行う.Suppose that, in an event such as a sports meeting or a concert, a user searches and gets video scenes taking interesting objects ``better'' from multiple perspective video that means a collection of mutually-synchronized video data taken by a lot of cameras. For such applications, one of the most important research issues is how to provide a mechanism that a user can find out interesting objects and create appropriate queries easily to get video scenes taking such objects, even if the user does not have enough knowledge about the objects and how to query them. Another issue is how to search video scenes that take the objects ``better''. In this paper, we propose a novel query method with camera metaphor for multiple perspective video. We consider ``query by camera'' with metaphor of video camera operations familiar with an ordinary user in order to create queries. A user finds out and specifies interesting objects while looking at scenes through a query camera's finder. Query parameters are time and focused object areas of the video interval taken by a query camera. Then multiple perspective video data with metadata of their time stamps and focused object areas are searched spatio-temporally. A user can get multiple stream video data taking focused objects and data indicating how the objects are taken in each video scene. We also describe a prototype of our query method and some experimental results of its search algorithm.
著者
佐藤進也 福田 健介 菅原 俊治 栗原 聡
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.14, pp.69-81, 2007-09-15
被引用文献数
1 or 6

文書に現れる語をノードとし,出現位置が近接しているものどうしをリンクで結び付けることにより得られる共起ネットワークでは,意味的関連性を有する語どうしがクラスタ構造と呼ばれる稠密な相互のつながりを形成している.本論文では,時間経過にともない文書が生成されていく,いわゆる文書ストリームから共起ネットワークを構成し,そこでクラスタ構造が生成される様子を調べた.その結果,共起ネットワークを(相対的に)古い語彙からなる部分と新しい語彙からなる部分に分けたとき,後者において,クラスタの出現という構造上の変化が,実社会の出来事などに起因する語の出現頻度の増大(バースト)に関連していることが明らかになった.In word co-occurrence networks, where two words appearing close to each other in documents are connected by a link, a group of relevant words forms a densely connected subnetwork called a cluster. In this paper, we analyze the process of emergence of the structure in co-occurrence networks generated from document streams. The analysis reveals that, if we restrict our scope to the subnetwork mostly consisting of (relatively) new words, we can associate emergence of the structure with the increase of word occurrence rate (bursts) that arises from real world events.
著者
中島 伸介 張 建偉 稲垣 陽一 中本 レン
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.1, pp.1-15, 2013-01-23

本研究では,小さいコミュニティから徐々に広がり,最終的に多くの人々に知れわたるような流行語を拡張型流行語と定義し,ブログ記事を時系列解析することで拡張型流行語の早期発見する手法に関する検討を行った.具体的には,すでにメジャーな流行語となったトピックに対し,ブログ上でどのように拡散していったのかを分析することで,早期発見に必要な分析手法について検討した. kizasi.jp で扱っている 3,776,154 ブログサイトで過去 2 年間に投稿された 81,922,977 件のブログ記事データの分析の結果,流行語候補がメジャーな流行語に発達する過程において,総発言数に占める,対象トピックと関連の深いコミュニティからの発言割合が減少しつつ,関連の薄いコミュニティからの発言割合が増加する状況を確認した.また,対象トピックと関連の深いコミュニティの特定手法を検討するとともに,総発言数に占めるこのコミュニティからの発言数の割合の減少状況について分析を行った.さらに,ライバル関係にある複数の流行語候補のランキングに基づく,提案手法の妥当性の検証を行った結果,良好な結果を得た.In this paper, we focus on "gradual buzzwords" that begin from a restricted community, spread little by little to other communities, and finally become widely known to most people, and discuss a method for their early detection by analyzing time-series data of blog entries. We observe the process in which certain topics grow to become major buzzwords and determine the key indicators that are necessary for their early detection. From the analysis results based on 81,922,977 blog entries from 3,776,154 blog websites posted in the past two years, we find that as topics grow to become major buzzwords, the percentages of blog entries from the blogger communities closely related to the target buzzword decrease gradually, and the percentages of blog entries from the weakly related blogger communities increase gradually. We also discuss how to identify the blogger communities which are closely related to these buzzwords, and conduct a slope analysis of percentage variation of blog entries from these closely related blogger communities. Moreover, we verify the effectiveness of the proposed method through experimentation that compares the rankings of several buzzword candidates with popularity competition.
著者
村井 聡一 牛尼 剛聡
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.4, pp.24-34, 2013-09-27

「立ち読み」は書籍選別に有効な手段である.これまでにも,ユーザのクエリに基づいて効果的な選別を行う手法は提案されているが,未読の小説においては,ユーザは小説本文に含まれるキーワードをクエリとして指定することは困難である.本論文では,Web上で閲覧できる電子化された小説を対象とし,「立ち読み」を始める箇所の効率的発見を支援するインタフェースを提案する.本インタフェースでは,小説の選別においては,小説の内容に興味をひかれるかどうかが重要と考え,「物語の進行における興味をひく度合いの推移」を可視化した興味喚起度マップを利用する.興味喚起度マップでは,ユーザの興味をひく度合いが高い単語が密に出現する箇所が,ユーザの興味をひく度合いが高いと考え,単語の興味をひく度合いは,小説のレビューを用いて推定する.興味喚起度マップは,層構造を持ち,上位の層は全体像の把握ために利用し,下位の層は詳細な内容の把握のために利用する.本インタフェースでは,ユーザが興味喚起度マップ上の単語をクリックすることによって,効率的に「立ち読み」を行うことができる.被験者による実験によって,本インタフェースを利用した「立ち読み」によって,Webブラウザを用いた「立ち読み」よりも,電子化された小説を効果的に選別できることが示された.Book browsing is one of effective methods to select books in bookstores. Some techniques have been proposed for supporting effective book selection based on user queries, but people can hardly give sufficient queries for unread novel. In this paper, we proposed a browsing interface for supporting a user to decide whether the user reads an electronic novel effectively on the web. Our interface provides an attractiveness map, which visualize a transition of attractiveness in a target novel, for effective selection of a novel. An attractiveness map has a layered structure and a section where high attractiveness words appear in high density has high value. The attractiveness of a term in a novel is estimated automatically from online book reviews of the novel. A user can browse the electronic novel effectively by clicking on attractiveness terms on the attractiveness map. Experimental results show that browsing of our interface supports users to decide whether the user would like to read a target novel or not more efficiently than browsing of a web browser.
著者
山家 雄介 中村 聡史 アダム ヤトフト 田中 克己
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.1, no.1, pp.88-100, 2008-06-26

ブログなどの普及により情報発信の裾野が広がるにつれて,Web 検索結果から有用なページを発見するのは困難になる一方である.最近ではユーザのブックマーク行動を集約することによって価値のあるページを抽出する,ソーシャルブックマークのような取り組みがさかんになりつつある.本稿では,ソーシャルブックマークにおけるページのブックマーク数などの情報を用いて,検索結果のページの内より有用なものを上位に提示する再ランキング手法を提案する.次に,提案手法を多数のクエリに対して適用し,検索結果に含まれるページの順位変動率や,ページの種類などを調査・分類し,どのような検索目的に本アプローチが有効なのかを明らかにした.