著者
林 良彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1999, no.22, pp.73-80, 1999-03-04
被引用文献数
1 or 0

英語の語彙データベースであるWordNet1.6の名詞部分を日本語へ手動で翻訳した。翻訳にあたりでは,英語の語彙的概念ノードであるsynsetを構成する英語単語を翻訳するだけでなく,その定義文(gloss)をも日本語へと翻訳した.その結果として,語彙概念にインデックスされた日英の対訳コーパスが得られた。本報告では,この日本語化されたWordNet名詞データの基本特性について報告し,本データが日英語の対照研究における良いリソースであること示す.また,synset単語の対応や上記の対訳コーパスからのバイリンガル辞書の抽出について説明し,得られるバイリンガル語彙データの多言語情報検索への適用可能性について検討する.The noun part of the WordNet 1.6 English lexical database was translated into Japanese by human translators. In the course of the translation work, elemental English words/collocations in a synset were translated into Japanese counterparts, as well as the "gloss", which defines the English lexical concept. This translation work turns out to give us an aligned and conceptually indexed pararell corpus. This paper shows the basic characteristics of the "Japanized" noun part of the WordNet. We argue that the resulted data might be a good resource for comparative linguistics. In addition to these, we examine how the derived bilingual lexical data can be applied to cross-linguistic natural language applications, such as cross-language information retrieval.

言及状況

はてなブックマーク (2 users, 2 posts)

[NLP][Corpus][CogLing][論文][あとで読む]

収集済み URL リスト