- 著者
-
宮崎 正弘
池原 悟
横尾 昭男
- 出版者
- 情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.34, no.4, pp.743-754, 1993-04-15
- 被引用文献数
-
14
機械翻訳システムにおいて、大規模辞書を効率的に構築し、維持管理することはきわめて重要である。本論文では、機械翻訳システムの解析辞書(日本語辞書)と変換辞書(対訳辞書)にどのような基準、条件で見出し語を収録したらよいかについて論じ、各種辞書の単語収録単位の違いを吸収するものとして単語結合型辞書引きを提案した。複合語は短単位語(語基)を組み合わせて数限りなく生成される。従って、このような複合語は、解析辞書には原則として収録せず、複合語は語基の組合せとして、その内部構造を解析する。一方、変換辞書には目的言語に応じて適切な訳を生成するため語基のほかに複合語を収録し、複合語の内部構造の解析により生成された部分複合語を基に、複合語内の語基を組み合わせて変換辞書引きを行う。この過程により、複合語は変換辞書にある見出し語の最適な組合せに再構成される。本方法により、数限りなく生成される複合語を原則として解析辞書に収録する必要がないので解析辞書のコンパクト化が図れ、解析辞書と変換辞書の独立性を確保でき、大親模辞書の効率的な構築・維持管理が可能になると共に、日本語の複含語に対する解析と変換処理の調和が実現できた。