著者
荻野 孝野 植田 禎子 小林 正博 井佐原 均
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.12, no.4, pp.21-54, 2005-08-26 (Released:2011-03-01)
参考文献数
16
被引用文献数
1 or 0

係り受け関係のついた大量のコーパスを元にして作成されたデータを対象として, 動詞の結合価に関する検討を行った.これは, 係り受け関係まで付与された大量データからなるコーパスが存在してはじめて可能となった分析である.動詞の結合価に関する検討は, 各動詞の基本的な格パターンに着目して結合価を決定することを中心として検討されてきた.しかし, 省略を含め, 結合価が実際の言語データでどういう形で出現しているかについて, 全容を示すようなものは報告されていない.ここでは, 大量のコーパスデータから作成した結合価データを用い, 実際のデータで動詞にかかる格助詞がどういうパターンで出ているのかを調査し, 格助詞パターンの出現状況を把握するとともに, それらの格助詞パターンを用いて同音異表記がどの程度判定できるかを検討した.動詞約12, 400概念 (表記の異なりレベルで約9, 400単語) から作成した動詞の格助詞組み合わせパターンは, 延べパターン数で37, 237パターン, 異なりパターンで188パターンとなった.また, 同音異表記セットについて, これらのパターンを用い, 表記確定を試みたところ, 結合価のうち格助詞組み合わせパターンの異なりによる判定でも格助詞パターンの出現頻度などを判定基準に付加することによって約73%の判定が可能であることがわかった.

言及状況

外部データベース (DOI)

Twitter (4 users, 9 posts, 1 favorites)

【BOT】 [ ネット上で読める日本語教育関連の論文・資料 043] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVzhuJ
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 043] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVQSTj
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 043] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVzhuJ
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 043] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVzhuJ
:BOT: [ ネット上で読める日本語教育関連の論文・資料など] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVzhuJ
1 1 https://t.co/CaWLGJbb9f
:BOT: [ ネット上で読める日本語教育関連の論文・資料など] ■ コーパスデータに基づく格助詞組み合わせレベルにおける結合価の実態と同音異表記判定での利用 https://t.co/z0JbxVzhuJ

収集済み URL リスト