著者
中渡瀬 秀一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2002, no.28, pp.39-46, 2002-03-15

本論文ではテキストデータを解析して,そこから類義語のグループを自動抽出する方法を提案する。提案する方法ではテキストを形態素解析した情報より2部グラフを構成し,その中の完全2部グラフが類義語のグループを構成するという傾向を利用して類義語の自動抽出を行う。この方法は大量のデータから多くの類義語候補を用意に収集するのに有用である。また2部グラフを構成する双方の頂点集合が類義語グループとそのグループの観点として解釈できるため,類義語のグループと同時にその観点も構成することができる。さらにグラフ間の順序関係によって類義語間の類似度を与えることもできるという特徴をもつ。This paper proposes a method for similar words groups extraction from nouns in a corpus. This method is based on maximal complete bipartite graph included bipartite graph made from compound nouns. In this bipartite graph, one node set tends to be a similar words group and the other node set to be a group of view point words, when the graph is complete. Further, this method can give also similarity measurements between words using relations among those similar words groups.

言及状況

はてなブックマーク (1 users, 1 posts)

via http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/academic-res/ueno0401.pdf 形態素解析→二部グラフ→完全二部グラフより類語グループ生成

収集済み URL リスト