著者
竹原 幹人 大島 裕明 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.171, pp.29-34, 2005-07-06
参考文献数
17

本論文では, Blogからニュース記事に対する意見を抽出し, Blogの書き手の興味を考慮して意見を提示するシステムの提案を行う.従来のWebではなくBlogという枠で考えることで, より最近の話題についての意見などの情報を提示することができ, また現在重要なものではなく今後重要になるかもしれない情報に着目することができるようになると思われる.Blogでは, 話題となっているニュースに対し, 書き手独自の視点に立った意見が書かれることが多い.多くのBlogからこのような意見を抽出し, 統合して提示を行う.またBlogには, 同じ書き手が書いた過去の記事が含まれる.これまでに書かれた記事から, 書き手の持つ興味を推測することが可能である.この興味を利用して意見を提示することで, ある話題に対しどのような人がどのような意見を述べているかを把握することができる.
著者
中谷 誠 Jatowt Adam 大島 裕明 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. データベース・システム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.146, pp.253-258, 2008-09-14
参考文献数
13

検索語が属する分野における専門語は,ユーザが検索結果に含まれるウェブページの内容を理解する上で重要な役割を持っている.専門語が多く含まれるウェブページは,非専門家ユーザにとっては理解しづらいが,一方で専門家ユーザにとっては読みやすく詳細な情報を得る上で有用である.本研究では,Wikipediaのリンク構造とカテゴリ構造を用いて,ユーザの入力した検索語からその語に関する専門語を抽出する手法について述べる.Wikipedia中で検索語が含まれている記事のカテゴリ情報を集約することによって検索語の属する専門領域を検出し,その領域の内外でリンクの出現頻度を分析することによって専門語を抽出する.本研究の提案手法は幅広い分野を網羅しており多言語対応しているWikipediaを用いているので,検索語の分野や言語に関係なく専門語を取得することができる.
著者
大島 裕明
出版者
京都大学
雑誌
若手研究(B)
巻号頁・発行日
2009

本課題では、リアルタイムに知識発見を行う技術の開発を行った。主に、2つの異なる方向性を持つ構文パターンを用いてWeb検索を行い、その検索結果のテキストから効率的に目的の知識を獲得する手法を用いて、様々な知識発見手法を開発した。様々な種類の知識を発見するために、適切な構文パターンを発見する手法についても開発した。さらに、様々な知識発見手法を用いたアプリケーションの作成を行った。
著者
田中 克己 チャットウィチェンチャイ ソムチャイ 田島 敬史 小山 聡 中村 聡史 手塚 太郎 ヤトフト アダム 大島 裕明
出版者
京都大学
雑誌
特定領域研究
巻号頁・発行日
2006

ウエブからの同位語等の概念知識の抽出,ウエブ検索クエリの意図推定・自動質問修正,ウエブ情報の信憑性分析,ユーザインタラクションやウエブ1.0情報とウエブ2.0情報の相互補完による検索精度改善に関する技術開発を行った.
著者
大島 裕明 小山 聡 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.72, pp.345-351, 2004-07-14
被引用文献数
2

個人のコンピュータには,その個人がどのような知識を持っているか,どのような考え方をしているか,ということが分かる情報が含まれている.しかし,それらはコンピュータに利用できるような状態にはなっていない.現在,さまざまな分野でシソーラスのような一般的な概念体系が用いられているが,個人のコンピュータに存在するコンテンツから個人的な概念体系が作成されれば,さまざまな分野におけるパーソナライザーションが可能になる.本稿では,個人コンピュータに存在する文書とその分類の方法から,個人的な概念体系を作成する手法について提案を行い,作成された個人的な概念体系を用いてウェブ情報検索におけるパーソナライゼーションを行う手法について提案を行う.A personal computer has a lot of documents. Those include much information that shows what the user is interested in, knows, and so on. However, the computer just has the information and it can not be used automatically. Now, common concept classification like thesaurus is used in many fields, so if the personal concept classification is created automatically based on the personal contents in the personal computer, it will be possible to be personalized in many fields. In this paper, we propose the way to create the personal concept classification from the personal contents and the method of the Web search personalization.
著者
小谷 彬 大島 裕明 小山 聡 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.149, pp.35-40, 2006-07-06

Webサイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWebサイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWebサイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWebサイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWebサイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.176, pp.157-162, 2004-07-06

近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバクライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.71, pp.199-205, 2004-07-13

近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバ・クライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.Recently, P2P network has been drawing attention. It is easier to share information on P2P network model than on server-client model. However, almost all researches study on improvement in the speed of retrieval. On the aspect of the information retrieval, matching file name with query is major, but it is very primitive and not enough to retrieve information efficiently. So, we find the problems of information retrieval on traditional P2P network, and we propose the system which provides more flexible information retrieval than one in the past.