著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.10, pp.2917-2928, 2006-10-15
参考文献数
18
被引用文献数
14

シソーラス辞書は,情報検索や自然言語処理,対話エージェントなどの研究領域において幅広くその有用性が実証されてきた.しかし,自然言語処理などによる従来のシソーラス辞書自動構築では,形態素解析や同義語・多義語の処理など,語の関連性を解析する前段階の処理において精度低下を招く要因がいくつかある.また,辞書作成時と利用時のタイムラグにより最新の語や概念への対応が困難であるという問題もある.そこで本論文では,これら2 つの問題を解決するために,ここ数年で急速にコンテンツ量を増加させたWiki ベースの百科辞典である「Wikipedia」に対し,Web マイニングの手法を適用することでシソーラス辞書を自動構築する方法を提案する.Thesauri have been widely used in many applications such as information retrieval, natural language processing (NLP), and interactive agents. However, several problems, such as morphological analysis, treatment of synonymous and multisense words, still remain and degrade accuracy on traditional NLP-based thesaurus construction methods. In addition, adding latest/miner words is also a difficult issue on this research area. In this paper, to solve these problems, we propose a web mining method to automatically construct a thesaurus by extracting relations between words from Wikipedia, a wiki-based huge encyclopedia on WWW.

言及状況

はてなブックマーク (5 users, 6 posts)

[論文][自然言語処理]
[論文][CiNii][自然言語処理][Wikipedia]
[pdf][wikipedia][mining]

Twitter (2 users, 3 posts, 1 favorites)

こんな論文どうですか? Wikipediaマイニングによるシソーラス辞書の構築手法(情報検索)(中山浩太郎ほか),2006 http://id.CiNii.jp/UOp8L
RT @hhhh_ : http://ci.nii.ac.jp/naid/110004822978/ 今からタモリ倶楽部までに読み終わらせる!

収集済み URL リスト