著者
荻野 孝野 植田 禎子 小林 正博 井佐原 均
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.12, no.4, pp.21-54, 2005-08-26 (Released:2011-03-01)
参考文献数
16
被引用文献数
1 1

係り受け関係のついた大量のコーパスを元にして作成されたデータを対象として, 動詞の結合価に関する検討を行った.これは, 係り受け関係まで付与された大量データからなるコーパスが存在してはじめて可能となった分析である.動詞の結合価に関する検討は, 各動詞の基本的な格パターンに着目して結合価を決定することを中心として検討されてきた.しかし, 省略を含め, 結合価が実際の言語データでどういう形で出現しているかについて, 全容を示すようなものは報告されていない.ここでは, 大量のコーパスデータから作成した結合価データを用い, 実際のデータで動詞にかかる格助詞がどういうパターンで出ているのかを調査し, 格助詞パターンの出現状況を把握するとともに, それらの格助詞パターンを用いて同音異表記がどの程度判定できるかを検討した.動詞約12, 400概念 (表記の異なりレベルで約9, 400単語) から作成した動詞の格助詞組み合わせパターンは, 延べパターン数で37, 237パターン, 異なりパターンで188パターンとなった.また, 同音異表記セットについて, これらのパターンを用い, 表記確定を試みたところ, 結合価のうち格助詞組み合わせパターンの異なりによる判定でも格助詞パターンの出現頻度などを判定基準に付加することによって約73%の判定が可能であることがわかった.
著者
横井 俊夫 仲尾 由雄 荻野 孝野 田中 裕一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.38, no.1, pp.32-43, 1997-01-15
被引用文献数
8

大規模な電子化辞書(その情報内容である言語知識)が概念レベルで持つべき情報構造を明らかにする.ここでいう電子化辞書とは 通常の辞書ばかりではなく シソーラス コーパス テキストベースなどを含む統合的な言語情報(言語知識)のことである.概念レベルは意味を扱う深層レベルの中で基準となる役割を果たす.表層レベルに最も近く それに沿う情報構造を持つ.なお この情報構造はEDR電子化辞書の成果を再整理することにより得られたものである.実現事例としてEDR電子化辞書の概念対応部分を仕様と統計データの両面から説明する.大規模知識ベースなどの議論に見られるように 大規模な情報や知識の構造を解明していく研究の重要性が指摘され始めている.本稿の内容は 本格的な実現事例を持つ初めての試みとなっている.This paper describes a model of the information structure of large-scale electronic dictionaries at the concept level that contain wide-ranging linguistic knowledge. The term electronic dictionary in this paper means an integrated body of linguistic information and knowledge that includes the information provided by thesauri, tagged corpora, and raw corpora as well as ordinary dictionaries. The concept level plays an important role for deep levels containing the information of semantic processing. It is the nearest to the surface level and its structure is similar. This information structure is obtained by rearranging the structure of the EDR Electronic Dictionary. An example of actual realization of the information structure is described in view of both the specifications and numeristic data of the EDR Dictionary at the concept level. Recently, the importance of the research on the structure of large-scale information and knowledge has become a focus of interest, as shown in the discussions for large-scale knowledge bases, etc. This paper introduces the results of the first trial including full-scale example of actual realization.