- 著者
-
赤間 啓之
仁科 喜久子
清水 由美子
三宅 真紀
- 出版者
- 東京工業大学
- 雑誌
- 基盤研究(C)
- 巻号頁・発行日
- 2006
グラフ理論に新しい計算手法を導入し、1)文献資源のトピックスを対象としたオントロジーの半自動生成と2)日英の双方に関し、連想概念情報検索システム-連想作文支援システムの開発(教育・学習資源の構築)に同時に適用する試み、3)日英双方の辞書資源(学研国語大辞典、WordNet)の意味ネットワークを介したシソーラスの自動生成や、4)様々な文献資源、特にフランス語の思想書(カバニス、メスメル)、小説(サンティグチュペリ)のトピックスの潜在的な意味分析を行った。特にグラフクラスタリング技術であるMCLを改良し、その結果をRMCLnet(グラフクラスタリング表示検索システム)、ACSS(連想作文等創造的発想支援システム)という、Web情報検索システムの形で公開した。また、国語辞典の意味ネットワーク形成にも応用すべく、形態素解析の後の人手によるチェック、特にひらがなに開かれた同音異義語の選定作業を行った。これらの成果は、国内外の学会(LREC2006, ICALT2006、 PACLIC21、 PACLNG-2007、 ED-MEIDIA2007など)で発表されている。RMCLは、収束段階で非連結になったMCLのクラスター結果を再入力し、クラスタリングの計算段階で過去に記録された隣接関係を復元して、それをもとに潜在的な隣接関係を復元したうえで、MCLを反復しておこなうものである。また、ハブ語のまわりにサイズの大きすぎるコアクラスターが生成したり、1クラスター1語というシングルトン・クラスターが生成したりする場合に、事後的にサイズ調整を行なうため、潜在隣接の概念を導入し、それをもとにしたBMCL(潜在隣接クラスタリング)という方法を編み出した。