nグラム統計によるコーパスからの未知語抽出

1 0 0 0 OA nグラム統計によるコーパスからの未知語抽出

著者: 森信介長尾眞
雑誌: 情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日: vol.39, no.7, pp.2093-2100, 1998-07-15

自然言語処理において,辞書は単語の文法的機能や意味の情報源として必要不可欠であり,辞書に登録されていない単語を減少させるため,辞書の語彙を増強する努力がなされている.新語や専門用語は絶えず増え続けているため,辞書作成の作業は多大な労力を要するのみならず,各解析段階での未知語との遭遇は避けらず,大きな問題の1つとなっている.この問題を解決するため,本論文では,nグラム統計を用いて,コーパスからの単語の抽出とその単語が属する品詞の推定を同時に行う方法を提案する.この方法は,同一品詞に属する単語の前後に位置する文字列の分布は類似するという仮定に基づく.実験の結果,本手法が未知語の品詞推定や辞書構築に有効であることが確認された.

2015-06-18 13:48:07
1 + 0 Twitter

http://id.nii.ac.jp/1001/00013000/

言及状況

Twitter (1 users, 1 posts, 0 favorites)

https://t.co/UGFp3EkuJm 似てるような気がするけどこっちは品詞などガン無視なのでちょっと違うなあ

収集済み URL リスト

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=13000&item_no=1&page_id=13&block_id=8 (1)