著者
池原 悟 宮崎 正弘 横尾 昭男
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.8, pp.1692-1704, 1993-08-15
被引用文献数
33

自然言語処理において意味処理を実現するには、意味処理の目的と範囲を明確にすること、また、それに合わせて必要な知識の種類とその分解能を見定めて収集整理することが大切である。本論文では、言語過程説の立場から言語表現の意味を「表現」に結びつけられた「対象」と話者の「認識」の関係と捉え、「意味処理」を言語表現に用いられた言語規範の種類を判別する「意味解析」と、話者と対象世界とを関係づける「意味理解」の二つに分けることを提案した。このうち目本語の「意味解析技術」を実現するために必要な言語知識について、さらに語彙に関する知識と用言を核とした表現構造に関する知識に分け、それぞれ単語意味辞書(名詞語約37万語)、構文意味辞書(文型数約1.3万文型)として収集整理することを試みた。両者は名詞の単語意味属性による記述を介して相互に結合されるため、それら辞書の記述能力は単語意味属性の分解精度で決まる。そこで、単語意味属性の分解精度と用言文型の記述能力との関係を調べると、従来の50?500種の意味属性分類では記述不能な用言の文型頻出するのに対して、約3000種に分類した場合は、一部の用言(補助用言など抽象度の大きいもの)を除いて、訳し分けに必要な文型がほぼ記述できることがわかった。文型記述能力向上の効果は、和語系の用書と専門用語の用言の持つ文型において著しく、記述能力はいずれも数倍以上となった。また、これによって記述された言語知識は機械翻訳において、用言と体言の訳し分けに効果があるだけでなく、複合語解析や文脈処理、訳しやすい日本文への自動書き換えなどの実現に有効であることがわかった。
著者
菅谷 史昭 竹澤 寿幸 横尾 昭男 山本 誠一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.11, pp.2362-2370, 2001-11-01

音声翻訳システムの新たな評価手法として翻訳一対比較法を提案し,ATR音声翻訳通信研究所が研究開発した音声翻訳システムで評価した.言語翻訳部単体,音声認識部と言語翻訳部を結合した場合の翻訳一対比較法の評価結果を述べるとともに,音声認識誤りのシステム性能に与える影響を分析した.また,評価結果を文ごとの平均単語エントロピーを使い分析し,同システムで採用されたコーパスベース音声翻訳システム性能の特徴を明らかにした.また,翻訳一対比較法の誤差解析を行った.
著者
内野 一 白井 諭 横尾 昭男 大山 芳史 古瀬 蔵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1167-1174, 2001-06-01
被引用文献数
1

機械翻訳システムの有効な活用として, 市況速報記事を対象にした日英機械翻訳システムを開発した.システムは, ルール型翻訳とテンプレート型翻訳とのハイブリッド構成であり, 実験では, 文単位で90%, 記事単位で70%の高い翻訳正解率を得ることができた.この評価結果に基づき, 更に対象を決算速報記事に限定し, テンプレート型翻訳による自動翻訳システムALTFLASHを構築した.ALTFLASHは日本語の決算速報を英文で配信する実用システムとして導入され, 従来人手で行われていた翻訳作業に比べ, 処理時間, 翻訳品質, 費用などの面で大幅な改善効果を示した.
著者
菅谷 史昭 竹澤 寿幸 横尾 昭男 山本 誠一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.11, pp.2362-2370, 2001-11-01
参考文献数
9
被引用文献数
17

音声翻訳システムの新たな評価手法として翻訳一対比較法を提案し, ATR音声翻訳通信研究所が研究開発した音声翻訳システムで評価した.言語翻訳部単体, 音声認識部と言語翻訳部を結合した場合の翻訳一対比較法の評価結果を述べるとともに, 音声認識のシステム性能に与える影響を分析した.また, 評価結果を文ごとの平均単語エントロピーを使い分析し, 同システムで採用されたコーパスベース音声翻訳システム性能の特徴を明らかにした。また翻訳一対比較法の誤差解析を行った.
著者
白井諭 大山 芳史 池原 悟 宮崎 正弘 横尾 昭男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告
巻号頁・発行日
vol.98, pp.47-52, 1998
被引用文献数
4

日英機械翻訳における高品質な意味解析を実現するため, 筆者らは日英機械翻訳システムの開発とともに, それに用いる意味辞書の構築を進めてきた。この意味辞書は, 単語や表現構造の意味を体系的に分類した意味属性体系, 単語に関する知識を収録した単語意味辞書, 用言を核とした表現構造を収録した構文意味辞書の3つから構成される。意味属性体系は, 対象の見方や捉え方が, 一般名詞意味属性, 固有名詞意味属性, および, 表現構造に対する用言意味属性として3種類3, 000属性に分類, 体系化されている。単語意味辞書は, 現代日本語の記述文への適用に耐えるよう, 単語の異表記や固有名詞20万語を含む40万語に対し, 文法情報のほかに, 一般名詞意味属性と固有名詞意味属性が付与されている。構文意味辞書は, 現在, 6, 000用言に対する表現構造が日英対訳形式で16, 000パターン収集され, 日本語パターンの格要素の名詞に対し一般名詞意味属性を用いた制約条件が記述され, 日本語パターン全体に対し用言意味属性が付与されている。本稿では, これらの意味辞書の開発経過と, それに基づいて作成した日本語語彙大系の概要について報告する。
著者
白井 諭 池原 悟 横尾 昭男 木村 淳子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.10, pp.2353-2361, 1995-10-15
被引用文献数
31

従来、述語間の係り受け関係の曖昧さの問題は、長文解析の精度を低下させる大きな要因であった。この問題を解決するため、日本語の意味的な階層的表現構遺に着目した従属節間の係り受け解析方式を提案し、その効果を示した。言語過程説の立場から見ると、日本語述語の間には書き手が対象をとらえて表現していく階層的な過程が反映していると考えられる。そこで、本論文では、日本語表出過程に着目した南不二男の3段階の階層的な従属節分類を、その意味と形式に着目して詳細化し、主節と従属節の述語を基本分類13種、細分類4種に分類した。そして、それらの階層的な順序関係を手がかりに、述語間の係り受け閣係を決定する方法を提案した。新聞記事972文(述語数含計2,327件、そのうち係り先の暖昧な述語は、661件)を対象とした実験結果によれば、従来の方法では、係り先の曖昧な述語が356件残ったのに対して、本論文の方法では、54件に減少し。、その結果、述語問の係り受け関係の解析において、係り先第1侯補の正解率は、92%から98%に向上した。
著者
宮崎 正弘 池原 悟 横尾 昭男
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.4, pp.743-754, 1993-04-15
被引用文献数
14

機械翻訳システムにおいて、大規模辞書を効率的に構築し、維持管理することはきわめて重要である。本論文では、機械翻訳システムの解析辞書(日本語辞書)と変換辞書(対訳辞書)にどのような基準、条件で見出し語を収録したらよいかについて論じ、各種辞書の単語収録単位の違いを吸収するものとして単語結合型辞書引きを提案した。複合語は短単位語(語基)を組み合わせて数限りなく生成される。従って、このような複合語は、解析辞書には原則として収録せず、複合語は語基の組合せとして、その内部構造を解析する。一方、変換辞書には目的言語に応じて適切な訳を生成するため語基のほかに複合語を収録し、複合語の内部構造の解析により生成された部分複合語を基に、複合語内の語基を組み合わせて変換辞書引きを行う。この過程により、複合語は変換辞書にある見出し語の最適な組合せに再構成される。本方法により、数限りなく生成される複合語を原則として解析辞書に収録する必要がないので解析辞書のコンパクト化が図れ、解析辞書と変換辞書の独立性を確保でき、大親模辞書の効率的な構築・維持管理が可能になると共に、日本語の複含語に対する解析と変換処理の調和が実現できた。