文献一覧: 斉藤いつみ (著者)

7 0 0 0 OA 文字列正規化パタンの獲得と崩れ表記正規化に基づく日本語形態素解析

著者: 斉藤いつみ貞光九月浅野久子松尾義博
出版者: 一般社団法人言語処理学会
雑誌: 自然言語処理 (ISSN:13407619)
巻号頁・発行日: vol.24, no.2, pp.297-314, 2017-03-15 (Released:2017-06-15)
参考文献数: 16
被引用文献数: 1

ソーシャルメディア等の崩れた日本語の解析においては,形態素解析辞書に存在しない語が多く出現するため解析誤りが新聞等のテキストに比べ増加する.辞書に存在しない未知語の中でも,既知の辞書語からの派生に関しては,正規形を考慮しながら解析するという表記正規化との同時解析の有効性が確認されている.本研究では,これまで焦点があてられていなかった,文字列の正規化パタン獲得に着目し,アノテーションデータから文字列の正規化パタンを統計的に抽出する.統計的に抽出した文字列正規化パタンと文字種正規化を用いて辞書語の候補を拡張し形態素解析を行った結果,従来法よりも再現率,精度ともに高い解析結果を得ることができた.

1 0 0 0 自然言語処理技術の現状と展望 -エラー分析プロジェクトを通して-:[基礎技術]3.1 形態素解析

著者: 森信介鍜治伸裕村脇有吾斉藤いつみ
雑誌: 情報処理
巻号頁・発行日: vol.57, no.1, pp.10-11, 2015-12-15

2015-12-15 17:08:41
1 + 0 Twitter

http://id.nii.ac.jp/1001/00146570/