著者
山中隆広 湯本高行 新居学 佐藤邦弘
雑誌
研究報告システムソフトウェアとオペレーティング・システム(OS)
巻号頁・発行日
vol.2014, no.12, pp.1-8, 2014-11-11

近年,情報検索におけるシステム向上により,入力したクエリに対して一般的に知られている情報を入手することは簡単である.しかし,一般的な情報ばかりでは既知の情報ばかりが推薦されてしまう問題がある.本研究では,クエリに関係し,かつ一般的にあまり知られていない情報,つまり希少な情報を推薦することを目的とする.手法として,クエリのカテゴリ推定を行い,ユーザが選択したカテゴリを用いて,クエリに関係するおおまかな文書集合を抽出する.その文書集合で所属確率と非典型度の二つの指標を組み合わせて希少なWebページの推薦を行う.それぞれの指標の算出には確率モデルを使用する.その結果,クエリに対して同義語のカテゴリでは平均適合率が 0.81 であった.
著者
青木 伸也 湯本 高行 角谷 和俊 新居 学 高橋 豐
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.16, pp.1-8, 2009-11-13
参考文献数
18

ニュースは同じトピックでも新聞社ごとに報道内容に違いがある.これは新聞社ごとに様々な論点に対しての見解が違うからで,1 つの新聞だけ読んだ読者は,他の新聞では異なる見解が示されているにも関らず,その 1 つの新聞と同じ見解を持ってしまう恐れがある.そこで,あるトピックについての新聞記事の集合から新聞社ごとの編集意図を抽出する手法を提案する.各見解は論点と極性 (ポジティブ/ネガティブ) からなるとし,その集合として編集意図をモデル化する.抽出の際には,見解を述べていると考えられる見解文に注目し,精度よく編集意図を抽出することを目指す.ユーザは可視化された編集意図を見ることで各社の見解の違いを比較することができる.When the several authors report the same news topic, reported facts are often different by the author. It is because each author has his own observation about various points of the news topic. If users read newspapers of only one author, they obtain biased understanding about the news topic. In this paper, we propose the method for extracting author intentions. We model author intentions as sets of observations consisted of (argument-point, positive/negative, strength of observation). In our proposed method, we use sentences which often express observation to extract author intention in high accuracy. Users can compare some authors by looking at visualized author intention.
著者
青木 伸也 湯本 高行 角谷 和俊 新居 学 高橋 豐
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.187-192, 2008-09-14
参考文献数
7

本論文では,同一事件を扱ったニュース記事集合内の特異な段落に注目し,発信者意図を抽出する手法を提案する.発信者意図は言及特異段落の集合と,不言及特異段落の集合から構成され,複数発信者間の意図の違いを表現する.これにより,ユーザのニュース記事の読み比べを支援することができる.本提案手法では,段落の言及,不言及特異度を定義し,閾値より大きいものを抽出する.評価実験では,適合率は平均 0.69 と比較的良い値が得られたが,再現率は平均 0.53 と低く,課題が残った.In this paper, we propose the method to extract author intentions based on peculiarity parts in related news articles. An author intention consists of mention peculiarity paragraphs and non mention peculiarity paragraphs, and expresses difference between intentions of some authors. This will support users to read and compare between news articles of some authors. In this proposed method, we define mention peculiarity and non mention peculiarity of paragraphs, and extract paragraphs having peculiarity more than a threshold. In experimental results, average precision was 0.69, and average recall was 0.53.
著者
岡田 崇 湯本 高行 新居 学 高橋 豐
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.33, pp.1-8, 2010-11-05

本論文では,Web 上での概念間の共通性に基づいた比較可能性の判定を行う手法を提案する.比較可能性とは概念が持つ重要な特徴が共通しているかどうかを表すものであり,似ているかどうかを表す指標である類似性とは異なる.概念は一般的な言葉を複数用いて説明できる語であり,その説明には他の概念や説明語を用いて表現される.説明語とは一般的に用いられる言葉のことで,それ以上の説明が不要な語である.本研究で扱う概念は商品や機能などに限定している.比較可能性の判定には,概念と説明語から生成した重み付き有向グラフを用いて行う.具体的には,概念の持つ特徴などを説明している文から重要な語を抽出し,それらの集合の関係から判定を行う.提案手法の有用性を評価するために,評価実験を行った.実験により,比較可能な概念間において,共通する重要な特徴が抽出できていることがわかった.