著者
池原 悟 宮崎 正弘 横尾 昭男
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.8, pp.1692-1704, 1993-08-15
被引用文献数
33

自然言語処理において意味処理を実現するには、意味処理の目的と範囲を明確にすること、また、それに合わせて必要な知識の種類とその分解能を見定めて収集整理することが大切である。本論文では、言語過程説の立場から言語表現の意味を「表現」に結びつけられた「対象」と話者の「認識」の関係と捉え、「意味処理」を言語表現に用いられた言語規範の種類を判別する「意味解析」と、話者と対象世界とを関係づける「意味理解」の二つに分けることを提案した。このうち目本語の「意味解析技術」を実現するために必要な言語知識について、さらに語彙に関する知識と用言を核とした表現構造に関する知識に分け、それぞれ単語意味辞書(名詞語約37万語)、構文意味辞書(文型数約1.3万文型)として収集整理することを試みた。両者は名詞の単語意味属性による記述を介して相互に結合されるため、それら辞書の記述能力は単語意味属性の分解精度で決まる。そこで、単語意味属性の分解精度と用言文型の記述能力との関係を調べると、従来の50?500種の意味属性分類では記述不能な用言の文型頻出するのに対して、約3000種に分類した場合は、一部の用言(補助用言など抽象度の大きいもの)を除いて、訳し分けに必要な文型がほぼ記述できることがわかった。文型記述能力向上の効果は、和語系の用書と専門用語の用言の持つ文型において著しく、記述能力はいずれも数倍以上となった。また、これによって記述された言語知識は機械翻訳において、用言と体言の訳し分けに効果があるだけでなく、複合語解析や文脈処理、訳しやすい日本文への自動書き換えなどの実現に有効であることがわかった。
著者
宮崎 正弘 白井 諭 池原 悟
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.2, no.3, pp.3-25, 1995-07-10 (Released:2011-03-01)
参考文献数
23
被引用文献数
1 3

三浦文法は、時枝誠記により提唱され三浦つとむにより発展的に継承された言語過程説に基づく日本語文法である。言語過程説によれば、言語は対象-認識-表現の過程的構造をもち、対象のあり方が話者の認識を通して表現されている。本論文では、三浦文法に基づいて体系化した日本語品詞体系および形態素処理用の文法記述形式を提案し、日本語の形態素処理や構文解析におけるその有効性を論じた。日本語の単語を、対象の種類とその捉え方に着目し、約400通りの階層化された品詞に分類して、きめ細かい品詞体系を作成した。本論文で提案した品詞体系と形態素処理用文法記述形式に基づき、実際に形態素処理用の日本語文法を構築した結果によれば、本文法記述形式により例外的な規則も含めて文法を簡潔に記述できるだけでなく、拡張性の点でも優れていることが分かった。本品詞体系により、三浦の入れ子構造に基づく意味と整合性の良い日本語構文解析が実現できるものと期待される。
著者
藤石 知夏 宮崎 正弘
雑誌
全国大会講演論文集
巻号頁・発行日
vol.49, pp.51-52, 1994-09-20

日本語において複合語は数多く出現するため、特に単語数の多い複合語に高い精度で正しいアクセントを付与することは、自然な日本文音声を出力する上で重要な課題となっている。本稿では、アクセント核を複数保有する複合語を適切なアクセント句に分割するため、複合語構造解析の結果得られた複合語の木構造を基に、単語間の意味的、文法的結合力を考慮した、複合語のアクセント句自動抽出法を提案する。
著者
高橋 博之 宮崎 正弘
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第49回, no.人工知能及び認知科学, pp.33-34, 1994-09-20

文字音韻変換処理は一般の単語については辞書を用いて行われる。しかし、数詞は表記が無数に生成できるため、全表記を辞書に収録することはできない。そのため、数詞は別処理で音韻付加する必要がある。日本語における数詞の表記は、算用数字表記、漢数字表記に加え両者の混ぜ書きも行われるなど多様である。本稿ではこれら多様な表記の数詞を処理するための可読性、拡張性に富むルールを提案し、その有効性を示す。
著者
宮崎 正弘 大山 芳史
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.27, no.11, pp.1053-1061, 1986-11-15

漢字かな混りの任意の日本語文を明瞭で自然な連続音声に自動変換するための言語処理方式を提案する.まず 基本となる文解析においては 解析精度と処理能力を両立させるものとして 局所的総当り法による形態素解析をベースとし 必要に応じて係り受け解析などより深い解析を行う多段解析法を提案する.さらに 文解析の結果を基に 文を高い精度で音韻列に自動変換し 自然な韻律情報を自動付与する方法を提案する.辞書については 43万語を収録した日本語辞書を構築し その高速検索を可能とした.本言語処理方式と音声合成装置を組合せて 高い精度と処理能力をもった実用的な日本文音声出力システムを開発した.
著者
白井諭 大山 芳史 池原 悟 宮崎 正弘 横尾 昭男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告
巻号頁・発行日
vol.98, pp.47-52, 1998
被引用文献数
4

日英機械翻訳における高品質な意味解析を実現するため, 筆者らは日英機械翻訳システムの開発とともに, それに用いる意味辞書の構築を進めてきた。この意味辞書は, 単語や表現構造の意味を体系的に分類した意味属性体系, 単語に関する知識を収録した単語意味辞書, 用言を核とした表現構造を収録した構文意味辞書の3つから構成される。意味属性体系は, 対象の見方や捉え方が, 一般名詞意味属性, 固有名詞意味属性, および, 表現構造に対する用言意味属性として3種類3, 000属性に分類, 体系化されている。単語意味辞書は, 現代日本語の記述文への適用に耐えるよう, 単語の異表記や固有名詞20万語を含む40万語に対し, 文法情報のほかに, 一般名詞意味属性と固有名詞意味属性が付与されている。構文意味辞書は, 現在, 6, 000用言に対する表現構造が日英対訳形式で16, 000パターン収集され, 日本語パターンの格要素の名詞に対し一般名詞意味属性を用いた制約条件が記述され, 日本語パターン全体に対し用言意味属性が付与されている。本稿では, これらの意味辞書の開発経過と, それに基づいて作成した日本語語彙大系の概要について報告する。
著者
宮崎 正弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.25, no.6, pp.970-979, 1984-11-15
被引用文献数
58

漢字 かな 英数字などの各種の文字で構成され 一般語の他に固有名詞も含んだ一般的な複合語に対する新しい自動分割法(係り受け解析法)を提案する.本解析法は次の三つの部分から構成される.第一は すべての可能な分割パターンを効率よく生成する部分 第二は 複合語を構成する単語が意味的にどのように結合しているかを解析するための係り受け解析部分 そして最後は 係り受け解析結果のなかから最適な分割パターンを選択する部分である.新聞記事に含まれる複合語の分割に適用した実験結果によれば 本手法は従来の最長一致法や分割数最小法に比べて精度よく 複合語を分割できることがわかった.
著者
宮崎 正弘 池原 悟 横尾 昭男
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.4, pp.743-754, 1993-04-15
被引用文献数
14

機械翻訳システムにおいて、大規模辞書を効率的に構築し、維持管理することはきわめて重要である。本論文では、機械翻訳システムの解析辞書(日本語辞書)と変換辞書(対訳辞書)にどのような基準、条件で見出し語を収録したらよいかについて論じ、各種辞書の単語収録単位の違いを吸収するものとして単語結合型辞書引きを提案した。複合語は短単位語(語基)を組み合わせて数限りなく生成される。従って、このような複合語は、解析辞書には原則として収録せず、複合語は語基の組合せとして、その内部構造を解析する。一方、変換辞書には目的言語に応じて適切な訳を生成するため語基のほかに複合語を収録し、複合語の内部構造の解析により生成された部分複合語を基に、複合語内の語基を組み合わせて変換辞書引きを行う。この過程により、複合語は変換辞書にある見出し語の最適な組合せに再構成される。本方法により、数限りなく生成される複合語を原則として解析辞書に収録する必要がないので解析辞書のコンパクト化が図れ、解析辞書と変換辞書の独立性を確保でき、大親模辞書の効率的な構築・維持管理が可能になると共に、日本語の複含語に対する解析と変換処理の調和が実現できた。