著者
吉田 慶章 柿崎 淑郎 辻 秀一
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.35, pp.23-30, 2009-03-18

政治家の発言情報を提供することで,ユーザのニュース記事理解を支援する方式を既に提案しているが,発言情報の収集を人手で行っていた点と,発言情報の表示手法に課題が残されていた.本研究では,発言情報の抽出手法と重要度算出手法から構成される自動収集手法を提案する.さらに,発言情報の表示手法も提案する.最後に,試作システムを用いた実験より,抽出手法の精度や重要度算出手法の妥当性等に関して評価を行う.We proposed a method to support for news understanding using politician's quotes. However, the method has two issues that extracting quote by hand and presentation method of quote. In this paper, we propose automatic methods to extract quotes and to calculate quote importance. In extract method, quotes are extracted using representation dictionary of quote, surface pattern rule and news ontology. In calculate method, quotes are calculated by elements of quote. Finally, we evaluate accuracy of the extract method and adequacy of the calculate method.
著者
酒井 哲也 野上 謙一
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.105-112, 2009-01-15
参考文献数
15

(株)ニューズウォッチは,ユーザの情報要求の変化をシステム側が促進し,ユーザが繰り返し検索を行う過程で有用な情報に 「出会う」 ことを可能にする探検型検索サイト「コトバ ノ ウチュウ」 を 2008 年 9 月に正式リリースした.このサイトでは,情報要求の変化促進の手段として,日本語版ウィキペディアの参照関係を視覚したインタフェース 「ギンガ」 を提供している.本研究では,「コトバ ノ ウチュウ」の 2008 年 10 月分のクエリログおよびクリックスルーデータを用い,ユーザが 「ギンガ」 上でどのようなクエリからどのようなクエリに遷移するかを分析した.その結果,ユーザは,人名から人名,組織名から組織名,地名から地名といったように現在のクエリと同一のタイプのクエリに遷移する明確な傾向があることがわかった.本知見は,探検型検索においてより有用なクエリ候補をユーザに提示するために役立てる予定である.In September 2008, NewsWatch, Inc. released an exploratory Web search site called KotobaNoUchu (Galaxies of Words), which encourages change in the user's information need and enables "serendipitous search" through repeated querying. To this end, KotobaNoUchu visualises the graph structures of Japanese Wikipedia, in a graphical interface called ginga (galaxy). In this study, we analyse the query log and clickthrough data of KotobaNoUchu from October 2008, to see how users move from a certain type of query to another on the ginga interface. Our results show that users clearly tend to make transitions within the same query type - from person names to person names, from place names to place names, and so on. We plan to utilise this finding for providing the user with more useful query candidates for exploratory search.
著者
江草 由佳 高久 雅生 齋藤 ひとみ 寺井 仁 三輪 眞木子 神門 典子
雑誌
研究報告情報学基礎(FI)
巻号頁・発行日
vol.2009-FI-95, no.20, pp.1-7, 2009-07-21

本研究では,サーチエンジンを用いた Web の情報探索行動を対象に,サーバサイドのクリックスルーログからだけでは捉えることのできない,サーチエンジンから検索結果を取得した後の探索行動を含めた全体の情報探索行動の特徴を明らかにすることを目的とし,課題の志向性や利用者の経験が与える影響について実験的な検討を行った.実験には大学学部生 11 名および大学院生 5 名が参加した.実験参加者には,世界史のレポートを作成するための情報を収集する 「Report 課題」 と,国内旅行の計画を立てるための情報を収集する 「Trip 課題」 の 2 つが与えられ,それぞれ 15 分間ずつ取り組んだ.どれくらいサーチエンジンの検索結果から離れたかを示す指標:LinkDepth を提案し,Link Depth を用いて実験参加者の Web 閲覧の特徴を示した.
著者
三原 鉄也 杉本 重雄
出版者
情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.11, pp.1-8, 2009-11-12
被引用文献数
1

紙とペンによって作られてきたマンガの作成過程においても、パソコン上のツールが利用される等、作成環境や配信環境の電子化が進められている。しかし実際のマンガ制作は、これらを前提としない昔ながらの漫画家と編集者の協業によって進められており、ディジタル化を活用した業務サポートによりマンガの生産性を高めることが求められている。本研究では、これを実現するためのディジタル環境を利用したマンガの制作の過程と、制作過程に作り出されるマンガの内容や諸要素とそれらの関係を記述するモデルについて述べる。さらにそのモデルを基礎とするマンガ制作支援ツールを提案する。Manga is a Japanese term meaning comics, cartoons, and graphic novels. Production process of manga has been moving from traditional Pen-and-Paper based task to PC-based task in networked digital environment. However, the design process of manga, which is the first half of the whole production process, is mainly agreement process between a manga creator and a producer responsible for publishing and is carried out by a traditional paper-centric communication between them. The goal of this study is improve the productivity of the design process of manga using a design support tool in digital environment. In this paper, we first show a model of whole production process of manga and discuss requirements to support the design process. Then, we propose a model to support the design process and a support tool based on the model.
著者
杉原 大悟 増市 博 梅基 宏 鷹合 基行
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.57-64, 2009-01-15
参考文献数
16
被引用文献数
1

本稿では,Wikipedia の記事タイトルを機械学習手法を用いて固有名詞クラスへと分類する際に Wikipedia のカテゴリ階層を分類器の素性として用いた場合の効果について報告する.ある記事タイトルに関連する Wikipedia のカテゴリネットワーク情報を分類器の素性として用いるために,あるカテゴリのカテゴリ階層構造をシンプルな基準 「主要カテゴリからの最短経路」 によって Wikipedia のカテゴリネットワークから抽出した.Wikipedia の語を関根の拡張固有名詞階層へ機械学習手法を用いて分類する実験において,得られたカテゴリ階層構造の効果を確認した.固有名詞クラスの粒度は荒いクラス分類 (固有名詞階層の深さ 2 ) と細かいクラス分類 (固有名詞階層の深さ 4 ) の 2 種類を用意し,荒い固有名詞分類においては 7 クラスおよび 15 クラスへと分類する実験,細かい固有名詞分類においては 118 クラスへと分類する実験を行った.カテゴリ階層構造を用いない場合と比較して,カテゴリ階層構造を用いた場合に,より良い F 値が得られた.最良の分類器による精度はそれぞれ F 値 91.33,F 値 89.68,F 値 84.06 であった.また,カテゴリ階層構造は Recall の向上に特に効果的であり,その効果は分類先の固有名詞分類の粒度が細かくなれば減少することが分かった.We consider the effect of hierarchical category structures of Wikipedia in experiments for named entity categorization based on machine learning methods. We extracted hierarchical category structures of each category simply based on the shortest path from " Category:Main Category" of Wikipedia. We checked the effect of the hierarchical category structure in categorization of term of Wikpedia to named entity class defined by Sekine's Extended Named Entity Hierarchy. We prepared 3 types of experimental settings on the number and granularity of named entity classes: The first one is categorization to rough-grained 7 classes of named entity, the second is categorization to rough-grained 15 classes of named entity and the third is categorization to fine-grained 118 classes of named entity. The classifier learned with the hierarchical category structure got better than those without hierarchical category structure in F-measure. The F-measures of our best classifier are respectively 91.33%, 89.68% and 84.06% in above 3 experimental settings. Our study found that hierarchical category structures are especially effective in the recognition of named entities in categorization to rough-grained classes of named entity and its effect declines in categorization to fine-grained classes of named entity.
著者
鈴木 郁美 原 一夫 新保 仁 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.65-70, 2009-01-15

コーパスから抽出した文脈情報により作成する専門用語グラフに対し,グラフを辿ることで節点間の類似度を計算する手法を適用し,類義語獲得に応用した.雑誌 「蛋白質・核酸・酵素」 をコーパスとして用いた実験で,コーパスでの出現頻度が少ない専門用語をクエリとして与えた場合,ラプラシアン拡散カーネル行列を用いた手法が比較的高い精度を示した.この結果は,専門性の高いレアな用語を既存のシソーラスに登録する場面において,ラプラシアン行列ベースの手法の有効性を示唆するものである.We apply graph-based methods to problems of biomedical synonym acquisition. Given a graph of biomedical terms constructed from a corpus, the methods calculate term similarities by traversing the graph to capture shared features between nodes. An experimental study shows that, for query terms appearing less than three times in the corpus, the Laplacian diffusion kernel gives better accuracy than the methods based on the adjacency matrix.
著者
富田 紘平 高村 大也 奥村 学
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.13-20, 2009-01-15
被引用文献数
2

重要文抽出と文圧縮を同時に行う新しい抽出的要約モデルを提案する.本手法は,重要文抽出に比べて表現能力が高いため,重要文抽出より適切な要約を出力することが期待できる.定式化には整数計画法を用いる.重要文抽出における過去の最も良い要約システムを,ROUGE-1 において大きく上回ることを確認した.We propose a novel extractive summarization model which performs sentence selection and compression at the same time. Because of its high expression ability, our model is expected to generate more appropriate summaries. Our model uses integer linear programming. Our model outperforms the previous best system on the ROUGE-1 metric.