著者
市丸 夏樹 中村 貞吾 宮本 義昭 日高 達
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1993, no.79, pp.21-28, 1993-09-16
被引用文献数
3

シソーラスを意味的な分類として利用し、コーパスから収集した用例と、確率文法を用いて派生語を解析する方法と、大量データに対する仮名漢字変換実験によるその方法の評価について述べる。派生語の語幹名詞と接尾語の連接性を大量の用例データから学習し、学習した用例に含まれていない派生語についても取り扱うことを可能とした。用例そのものを学習に使用した場合には、生成能力が不十分であることが判明したため、用例の語幹をシソーラス上の上位語で置き換えた、一般化サンプルを使用した仮名漢字変換実験を行った。その結果、用例の一般化によって十分な生成能力を得ることができ、正解率を向上させることができることを示した。We are engaged in a research on using a thesaurus to analyze Japanese derivative words, and presented Example-Based Approach with Stochastic Grammar, which gives preference to words of high frequency. Using only raw examples for learning, however, turned out to be failure to produce enough derivative words out of given examples. Our solution to this problem was to use generalized examples for learning; i.e. to propagete the suffixes to synonyms of the body of the examples. In an experiment on kana-kanji convertion, we confirmed that there was a great improvement in number of correct answers.
著者
日高 達 市丸 夏樹 冨浦 洋一
出版者
九州大学
雑誌
基盤研究(C)
巻号頁・発行日
1997

本研究は,構文構造の曖昧性解消に利用されてきた語の係り受け関係を句構造文法の統語規則により組み込む方法と,確率文法のパラメタを複合化することにより構文解析の正解率を改善する手法の開発を目的とし,次のような研究成果を得た.1. 語彙の共起制約を包含する文脈自由文法の構成法統語範疇(品詞)に基づく自然言語の句構造文法を,(統語範疇,head word,function word)の3組に基づく句構造文法に組み変えることにより,統語範疇の構造制約と語彙の共起制約の両方を満足する文脈自由文法の構成法を提案した.ここで,語彙の共起制約とは語の係り受け関係と文節における付属語の連接条件を指している.この研究成果は,従来難しいとされてきた,語彙の共起制約の句構造文法への組込み法を与えた点で評価に値する成果である.2. 確率文法の複合化手法の開発確率文脈自由文法の近似性能を向上するための複合化モデルを提案した.複合化することにより尤度の向上が計れることを示し,また複合化度mおよびm組の確率パラメタ推定式をBaumの不等式を用いて導いた.確率文脈自由文法の高速構文解析機であるEarleyの手法を拡張して複合化確率文法モデルの構文解析アルゴリズムを構成した.曖昧な構文構造を生成する文を収集し,正解の構文構造をランダムに選出して,標本集合とし,標本集合からm組の確率パラメタを(1)の推定式に基づいて算出し,(2)の構文解析手法により構文解析を行なって正解率を実験的に算定した.その結果,単独の確率文法を用いることに較べ,複合化確率文法の場合に正解率の向上が顕著であることを実証した.
著者
市丸 夏樹 飛松 宏征 日高達
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.23, pp.43-48, 2004-03-04
被引用文献数
3

本稿では,論説文を読みやすいinformativeな要約文へと自動的に要約するための手法を提案する.まず,文章を段階的に段落分けし,階層的な結束構造を構築する.その際,文間,段落間の繋がりを計測するために,従来の語彙結束性に代えて話題間の連想による話題の流れのよさを表す値を用いる.論説文中の段落列に着目すると,導入部を表す段落から展開部を通って結びへ至る大きな話題の流れが見られることが多い.そこで,我々の要約システムはその大きな流れこそが書き手の主張を表す文脈の本流であるとみなす.最後に,流れを構成する文とその流れへの寄与度が高い文を抽出することによって,流れのよい読みやすい要約文が得られる.In this paper, we propose a method of automatic summarization to produce easy-to-read, informative summaries of editorial articles. Firstly, the document is segmented hierarchically to form a multi-layer paragraph structure. Instead of lexical cohesion, associative relations between subjects are used to measure subject-flow consistency between sentences and between paragraphs. In a paragraph, the most significant subject-flow stream runs from an introductory subparagraph to conclusive one through some intermediates. Thus, our system regards this flow as the contextual main stream of the document. Finally, several sentences which have greater contribution ratio in the flow are extracted gradually, to form a multistage summary which has maximum consistency.