Conditional Random Fieldsを用いた日本語形態素解析

1 0 0 0 OA Conditional Random Fieldsを用いた日本語形態素解析

著者: 工藤拓山本薫松本裕治
雑誌: 情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日: vol.2004, no.47(2004-NL-161), pp.89-96, 2004-05-14

本稿では Conditonal Random Fields (CRF) に基づく日本語形態素解析を提案する. CRFを適用したこれまでの研究の多くは単語の境界位置が既知の状況を想定していた. しかし日本語には明示的な単語境界が無く単語境界同定と品詞同定を同時に行うタスクである日本語形態素解析にCRFを直接適用することは困難である. 本稿ではまず単語境界が存在する問題に対するCRFの適用方法について述べる. さらに CRFが既存手法(HMM MEMM) の問題点を自然にかつ有効に解決することを実データを用いた実験と共に示す. CRFは階層構造を持つ品詞体系や文字種の情報に対して柔軟な素性設計を可能にし label biasやlength biasを低減する効果を持つ. 前者はHMM の欠点であり後者はMEMMの欠点である. また 2つの正則化手法(L1-CRF/L2-CRF) を適用しそれぞれの性質について論じる.

2017-10-16 15:53:17
1 + 0 Twitter

http://id.nii.ac.jp/1001/00048176/

言及状況

Twitter (1 users, 1 posts, 0 favorites)

Mecabの動作気になる人は、論文 https://t.co/UHtJdlUD0A か、比較的最近（といっても10年近く前）のスライド https://t.co/2vhrQPsa8K がオススメです

収集済み URL リスト

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=48176&item_no=1&page_id=13&block_id=8 (1)