著者
吉岡 由智 湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.68, pp.415-420, 2005-07-14
参考文献数
9
被引用文献数
3

現在テレビやWebなどを通して膨大な数のニュース記事が配信されているが,配信されてきたニュース記事をそのまま閲覧,視聴するのではなく,一旦マルチメディアニュースアーカイブに保存しておき,そこでそれらの内容的な関係やそれを配信する者の視点の違いなどを抽出して示すことができれば,利用者はこの膨大な数のニュース記事をより有効に利用することができる.そこで本稿ではニュース記事の集合からニュース配信者の視点を抽出し,それらからトピック毎のニュースの全体像を構築する手法を提案する.トピックを伝える側の視点はトピックのテーマ,トピックの側面,トピックの側面を構成する要素からなっており,各ニュース記事から抽出される.トピックの全体像は視点を統合することによって構築する.全体像と視点を示すことによって利用者はトピックを多角的にとらえることができる.In present day, we can get enormous numbers of news articles on the Web and through TV. When news articles are stored in multimedia news archive, and the relationships of the articles and focused points of news distributors are extracted, user can use news data more effectively. In this study, we propose a way of extracting focused points of news distributors from news articles, and building an overall feature about each topic. The focused point consists of "a theme of topic", "the aspect of topic", and "the element of aspect". They are extracted from each news article. An overall feature is built by integrating focused points. By showing a overall feature and focused points about a topic, users can see the topic from various viewpoints.
著者
平野 真太郎 吉岡 由智 成凱 岩井原 瑞穂
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.71, pp.25-30, 2004-07-13
参考文献数
4

ウェブの大きな特徴として,ホットスポットとよばれる少数のウェブサイトに利用が大きく偏っていることが分かっている.膨大なウェブの効率的な活用のために我々は利用者の興味を反映したホットトピックを検出するトピックセンサー[1]を提案してきた.しかし,トピックごとの利用頻度を計算する際トピックの階層構造を考慮しておらず,ホットトピックの検出手法は単純である.本稿ではトピックセンサーの拡張としてHHH(Hierarchical Heavy Hitters) アルゴリズム[2]を用いてトピックの階層構造をより効果的に扱う方法を提案する.Yahoo!カテゴリからトピックの階層構造を抽出し,アクセス履歴における利用状況を考慮することによって時間軸を考慮したホットトピックの検出を行った.トピックの特徴,例えば朝によく利用されるトピック,夜間によく利用されるトピックなどの時間帯による利用状況が知ることができれば,インターネット広告においてより効果的な広告,高度な課金システムの作成が可能になると考えられる.実験では時間帯によるトピックの利用状況を解析し,時間帯によってトピックが3つのタイプに分かれることを確かめた.A salient feature of the web is its biased usage where a few hot spot sites account for most accesses. To detect the hot topics that reflect users' interest, we have developed a system, called topic sensor [1]. However, in that work, we did not take into account the hierarchical structure while counting the access frequencies of each topic. In this paper, we extend that work by allowing topic hierarchy and detect hot topics by Hierarchical Heavy Hitters (HHH) detection algorithms of [2]. We adopt topics Yahoo! directory, and determine their "hotness " by using access logs from shared proxy servers. We demonstrated that a special feature of the usage of topics, for example one topic is often accessed in the morning, the other is often accessed in the night, can improve current Internet Advertisement. We report the result of analysis by hours and ensured that Topics are enabled to divide into 3 types.
著者
吉岡 由智 湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.68, pp.415-420, 2005-07-14
被引用文献数
3

現在テレビやWebなどを通して膨大な数のニュース記事が配信されているが,配信されてきたニュース記事をそのまま閲覧,視聴するのではなく,一旦マルチメディアニュースアーカイブに保存しておき,そこでそれらの内容的な関係やそれを配信する者の視点の違いなどを抽出して示すことができれば,利用者はこの膨大な数のニュース記事をより有効に利用することができる.そこで本稿ではニュース記事の集合からニュース配信者の視点を抽出し,それらからトピック毎のニュースの全体像を構築する手法を提案する.トピックを伝える側の視点はトピックのテーマ,トピックの側面,トピックの側面を構成する要素からなっており,各ニュース記事から抽出される.トピックの全体像は視点を統合することによって構築する.全体像と視点を示すことによって利用者はトピックを多角的にとらえることができる.In present day, we can get enormous numbers of news articles on the Web and through TV. When news articles are stored in multimedia news archive, and the relationships of the articles and focused points of news distributors are extracted, user can use news data more effectively. In this study, we propose a way of extracting focused points of news distributors from news articles, and building an overall feature about each topic. The focused point consists of "a theme of topic", "the aspect of topic", and "the element of aspect". They are extracted from each news article. An overall feature is built by integrating focused points. By showing a overall feature and focused points about a topic, users can see the topic from various viewpoints.