著者
服部 峻 湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.68, pp.553-560, 2005-07-14
被引用文献数
1

WWWやモバイル端末の普及に伴い,いつでも,どこからでも,様々な種類の地域情報にアクセスすることが可能になって来た.また,測位機能付きのモバイル端末を用いれば,ユーザの現在位置に依存した情報を取得することもできる.しかし,実空間を特徴付ける要素として,従来研究のように,地理的位置だけを用いていたのでは,地理情報データベースに登録されている地理語の粒度に限界があるため,ユーザの現在いる実空間により相応しい情報を呈示することは困難である.この問題に対して,本研究では,実空間内に在る展示物や建物の名称や説明,ポスターの内容,デバイスの出力情報などの実世界コンテンツが発信している情報を取得し活用することで,ユーザの現在いる実空間により相応しい情報を検索することを可能にする.本稿では,ユーザの現在いる実空間を地理語と特徴キーワードとで表現する.そして,これらの検索クエリーに対して情報がどのくらい相応しいかを測る尺度として,情報の実空間相応度を定義し,この評価値に基づく情報ランキング手法を提案する.As use of the World Wide Web(WWW) and mobile devices spreads and becomes more advanced, people can increasingly access various kinds of local information for use in daily life. And moreover, using mobile devices equipped with geo-positioning facilities, we are able to retrieve information related to our current location. But, we cannot get information more adapted to real world environment near around user, only inputing user's geo-position as a query to an information retrieval system. In contrast, we propose an information retrieval method that searches for more local information than the degree of granularity of geographical word converted from user's current location, taking advantage of real spatial contents and activities around user. In this paper, we define the notion of Spatial Fitness that is a measure of how fit information is for real space in which user is now.
著者
山中隆広 湯本高行 新居学 佐藤邦弘
雑誌
研究報告システムソフトウェアとオペレーティング・システム(OS)
巻号頁・発行日
vol.2014, no.12, pp.1-8, 2014-11-11

近年,情報検索におけるシステム向上により,入力したクエリに対して一般的に知られている情報を入手することは簡単である.しかし,一般的な情報ばかりでは既知の情報ばかりが推薦されてしまう問題がある.本研究では,クエリに関係し,かつ一般的にあまり知られていない情報,つまり希少な情報を推薦することを目的とする.手法として,クエリのカテゴリ推定を行い,ユーザが選択したカテゴリを用いて,クエリに関係するおおまかな文書集合を抽出する.その文書集合で所属確率と非典型度の二つの指標を組み合わせて希少なWebページの推薦を行う.それぞれの指標の算出には確率モデルを使用する.その結果,クエリに対して同義語のカテゴリでは平均適合率が 0.81 であった.
著者
吉岡 由智 湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.68, pp.415-420, 2005-07-14
参考文献数
9
被引用文献数
3

現在テレビやWebなどを通して膨大な数のニュース記事が配信されているが,配信されてきたニュース記事をそのまま閲覧,視聴するのではなく,一旦マルチメディアニュースアーカイブに保存しておき,そこでそれらの内容的な関係やそれを配信する者の視点の違いなどを抽出して示すことができれば,利用者はこの膨大な数のニュース記事をより有効に利用することができる.そこで本稿ではニュース記事の集合からニュース配信者の視点を抽出し,それらからトピック毎のニュースの全体像を構築する手法を提案する.トピックを伝える側の視点はトピックのテーマ,トピックの側面,トピックの側面を構成する要素からなっており,各ニュース記事から抽出される.トピックの全体像は視点を統合することによって構築する.全体像と視点を示すことによって利用者はトピックを多角的にとらえることができる.In present day, we can get enormous numbers of news articles on the Web and through TV. When news articles are stored in multimedia news archive, and the relationships of the articles and focused points of news distributors are extracted, user can use news data more effectively. In this study, we propose a way of extracting focused points of news distributors from news articles, and building an overall feature about each topic. The focused point consists of "a theme of topic", "the aspect of topic", and "the element of aspect". They are extracted from each news article. An overall feature is built by integrating focused points. By showing a overall feature and focused points about a topic, users can see the topic from various viewpoints.
著者
青木 伸也 湯本 高行 角谷 和俊 新居 学 高橋 豐
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.16, pp.1-8, 2009-11-13
参考文献数
18

ニュースは同じトピックでも新聞社ごとに報道内容に違いがある.これは新聞社ごとに様々な論点に対しての見解が違うからで,1 つの新聞だけ読んだ読者は,他の新聞では異なる見解が示されているにも関らず,その 1 つの新聞と同じ見解を持ってしまう恐れがある.そこで,あるトピックについての新聞記事の集合から新聞社ごとの編集意図を抽出する手法を提案する.各見解は論点と極性 (ポジティブ/ネガティブ) からなるとし,その集合として編集意図をモデル化する.抽出の際には,見解を述べていると考えられる見解文に注目し,精度よく編集意図を抽出することを目指す.ユーザは可視化された編集意図を見ることで各社の見解の違いを比較することができる.When the several authors report the same news topic, reported facts are often different by the author. It is because each author has his own observation about various points of the news topic. If users read newspapers of only one author, they obtain biased understanding about the news topic. In this paper, we propose the method for extracting author intentions. We model author intentions as sets of observations consisted of (argument-point, positive/negative, strength of observation). In our proposed method, we use sentences which often express observation to extract author intention in high accuracy. Users can compare some authors by looking at visualized author intention.
著者
青木 伸也 湯本 高行 角谷 和俊 新居 学 高橋 豐
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.187-192, 2008-09-14
参考文献数
7

本論文では,同一事件を扱ったニュース記事集合内の特異な段落に注目し,発信者意図を抽出する手法を提案する.発信者意図は言及特異段落の集合と,不言及特異段落の集合から構成され,複数発信者間の意図の違いを表現する.これにより,ユーザのニュース記事の読み比べを支援することができる.本提案手法では,段落の言及,不言及特異度を定義し,閾値より大きいものを抽出する.評価実験では,適合率は平均 0.69 と比較的良い値が得られたが,再現率は平均 0.53 と低く,課題が残った.In this paper, we propose the method to extract author intentions based on peculiarity parts in related news articles. An author intention consists of mention peculiarity paragraphs and non mention peculiarity paragraphs, and expresses difference between intentions of some authors. This will support users to read and compare between news articles of some authors. In this proposed method, we define mention peculiarity and non mention peculiarity of paragraphs, and extract paragraphs having peculiarity more than a threshold. In experimental results, average precision was 0.69, and average recall was 0.53.
著者
岡田 崇 湯本 高行 新居 学 高橋 豐
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.33, pp.1-8, 2010-11-05

本論文では,Web 上での概念間の共通性に基づいた比較可能性の判定を行う手法を提案する.比較可能性とは概念が持つ重要な特徴が共通しているかどうかを表すものであり,似ているかどうかを表す指標である類似性とは異なる.概念は一般的な言葉を複数用いて説明できる語であり,その説明には他の概念や説明語を用いて表現される.説明語とは一般的に用いられる言葉のことで,それ以上の説明が不要な語である.本研究で扱う概念は商品や機能などに限定している.比較可能性の判定には,概念と説明語から生成した重み付き有向グラフを用いて行う.具体的には,概念の持つ特徴などを説明している文から重要な語を抽出し,それらの集合の関係から判定を行う.提案手法の有用性を評価するために,評価実験を行った.実験により,比較可能な概念間において,共通する重要な特徴が抽出できていることがわかった.
著者
吉岡 由智 湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.68, pp.415-420, 2005-07-14
被引用文献数
3

現在テレビやWebなどを通して膨大な数のニュース記事が配信されているが,配信されてきたニュース記事をそのまま閲覧,視聴するのではなく,一旦マルチメディアニュースアーカイブに保存しておき,そこでそれらの内容的な関係やそれを配信する者の視点の違いなどを抽出して示すことができれば,利用者はこの膨大な数のニュース記事をより有効に利用することができる.そこで本稿ではニュース記事の集合からニュース配信者の視点を抽出し,それらからトピック毎のニュースの全体像を構築する手法を提案する.トピックを伝える側の視点はトピックのテーマ,トピックの側面,トピックの側面を構成する要素からなっており,各ニュース記事から抽出される.トピックの全体像は視点を統合することによって構築する.全体像と視点を示すことによって利用者はトピックを多角的にとらえることができる.In present day, we can get enormous numbers of news articles on the Web and through TV. When news articles are stored in multimedia news archive, and the relationships of the articles and focused points of news distributors are extracted, user can use news data more effectively. In this study, we propose a way of extracting focused points of news distributors from news articles, and building an overall feature about each topic. The focused point consists of "a theme of topic", "the aspect of topic", and "the element of aspect". They are extracted from each news article. An overall feature is built by integrating focused points. By showing a overall feature and focused points about a topic, users can see the topic from various viewpoints.
著者
湯本 高行 角谷 和俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.43-48, 2008-09-14

本研究では各コンテンツに対するソーシャルブックマークの時間的な分布を分析し,その結果に基づき,コンテンツライフサイクルを提案する.コンテンツライフサイクルはコンテンツの注目のされ方にライフサイクルがあるとみなし,そのステージを表現するものである.提案するコンテンツライフサイクルは成長期,成熟期,衰退期の 3 つのステージからなり,時間の経過による平均ブックマーク間隔の変化に対して,回帰分析を行い,その際の傾きと決定係数によって,各コンテンツのステージが決まる.また,提案したコンテンツライフサイクルによって,各コンテンツがどのように分類されるかを分析した.その結果,成長期,成熟期には Web 上のサービスや定期的に更新されるコンテンツが多く,衰退期にはブログ記事などの更新されないコンテンツが多いことがわかった.In this paper, we analyze distribution of social bookmark for each Web page. Based on it, we propose a content life cycle, which expresses a status of the content in its life cycle. Content life cycle consists of 3 periods, growth period, maturity period and decline period. Period of content life cycle is judged by slope and determination coefficient of regression line of mean bookmarking interval. We classified some Web contents into 3 periods of content life cycle, and analyzed them. We found that Web contents in growth and maturation periods contain services on the Web and Web pages which are constantly updated. We also found that Web contents in decline period contain unchanged Web contents such as blogs.
著者
湯本 高行 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.83-92, 2007-06-15

知りたい情報について知識がない状態で検索を行う場合,ユーザは検索結果を閲覧しても,必要なすべての情報を得られたのかどうかを判断することができない.また,現在のページごとの検索では知りたい事柄について1ページで十分な情報を持ったページが存在するとは限らず,そのため解として適切なページが見つかるとは限らない.そこで,ユーザの求める情報の全容を表すページ集合を発見する全容検索を提案する.全容検索は,通常のページごとの検索結果から,あるキーワードについて話題の広さと深さの両方を兼ねそなえたページ集合を生成し,それをランキングする.全容検索では,話題の漏れのないようにページを網羅的に収集するのではなく,検索結果集合から詳細グラフという語の詳細関係を表すグラフを計算し,ページ集合の表す内容やページ間の内容の重複を表現し,ページ間の内容の重複ができるだけ少なく,ユーザが効率良く閲覧できるようなページ集合を生成する.本稿では,ページ集合を対象とした全容検索と通常の検索やページごとの全容検索などを比較し,ページ集合を解として全容検索をすることの有効性を示す.When a user searches Web by a query keyword X about which he/she has no knowledge, it is difficult for him/her to evaluate to what extent each answer page includes topics about X. Furthermore, conventional page-by-page search might not always return an appropriate page as an answer that include enough topics about X. In order to solve these problems, we propose overview search to find page sets which describe overview about what users want to know. Overview search is to find page sets which describe both of wide topics and deep detail about a given query and rank them. However, users don't want to browse too big page sets. Therefore, in overview search, pages in a page set should have less duplicated information. We construct as compact page set as possible by using a Detailing Graph. The Detailing Graph represents detailing-relationship between terms in search results. We express the information which page sets have and the duplication between pages by using the Detailing Graph and construct the page sets which have more information and less duplication. In this paper, we compare our overview search returning page sets as answers, overview search returning pages as answers and conventional Web search. We show some experimental results and the effectiveness of overview search.