菅沼 明 笠原 晋 牛 和夫
情報処理学会論文誌 (ISSN:18827764)
vol.37, no.6, pp.1007-1016, 1996-06-15

日本語文章は単語単位に分割して書かれないために これを機械処理するには まず形態素解析などの文法処理を行うのが普通である.しかし 文法処理を行っても 解が一意に定まらなかったり 解析時間がかかったりする問題がある.そのため 我々は 字面だけの情報で接続助詞「が」や否定表現 受身形などの候補を抽出する方法を構築し それを応用して日本語文章推〓支援ツール『推〓』を開発している.本論文では 簡単な表を利用した字面解析手法を用いて日本語文章中にある活用語の活用形を推定する方法(「活用チェック法」と呼ぶ)について述べる.活用語を語幹と語尾に分け それぞれについて表を設ける.文を後ろから前に遡る方向にスキャンしながら まず語尾の表と比較を行う.その後 語幹の表との比較を行う.語幹に関しては最後の1文字しか評価しない.活用チェック法で使用する表の大きさは32KB程度で これを主記憶に載せたとしても 記憶域を圧迫するものではない.そのため 主記憶容量が小さな計算機であっても主記憶に載せることが可能である.従来の字面抽出法と比較するために 接続助詞「が」と否定表現の抽出に活用チェック法を適用し 抽出精度を比較した.その結果 従来の字面抽出法に比べて適合率が約10%向上した.再現率は100%を保っている.さらに 活用チェック法を使用した抽出法は 従来の抽出法と比較して 抽出に要する時間はほとんど変わらない.Japanese documents are usually analyzed with the grammatical analysis like the morphological analysis. Since this analysis requires much time, we constructed an extraction method with only textual information for the passive voice, the negative expressions, the conjunctive particle "GA," and so on. And we are developing a system of writing tools SUIKOU with the textual analysis method. This paper describes a method to estimate the conjugation of Japanese verbs and adjectives with a textual analysis. We prepare two kinds of tables for a conjugational part and a non-conjugational part of Japanese verbs and adjectives. This method analyzes a Japanese document from tail to head of a sentence with these tables. Using the method, we construct a new extraction method for the conjunctive particle "GA" and the negative expressions. This extraction method guarantees to extract all requested items, but it may extract some unrequested items. The precision of the new extracting method for the conjunctive particle "GA" is above 98%, and is improved by 7% in comparison with that of old one, although the new method is able to extract the conjunctive particle "GA" as fast as old one.


