著者
小木曽 智信
雑誌
じんもんこん2012論文集
巻号頁・発行日
vol.2012, no.7, pp.25-32, 2012-11-10

旧仮名遣いで書かれた口語文のテキストを形態素解析する場合、既存の形態素解析辞書では不十分な点があった。発表者は既存の形態素解析辞書UniDicをベースに見出し語の追加やコストの再学習を行い、旧仮名遣いの口語文を解析するのに適した新しいUniDicを開発した。本稿では、この旧仮名遣いの口語文を対象とした形態素解析辞書の作成方法とその解析精度について述べる。

言及状況

Twitter (17 users, 18 posts, 8 favorites)

@acy さう。だから俺の構想は無謀なんです。30年前の作り方。辞典に載ってる語に加へて、最新の固有名詞をドバドバ拾って入れていかないといけない。果てしない。 なほ学術分野では正かなのコーパスを作るために、青空文庫を利用した例がある。 https://t.co/9VsiQ7qXZz
@nagise MeCab と 旧仮名口語UniDic の組み合はせである程度はどうにかなる感じ、なのか? (ざつくり流し讀みしただけ) UniDic https://t.co/p5YTg8e9ZZ 『旧仮名遣いの口語文を対象とした形態素解析辞書」 https://t.co/rNGYzfT6q1
「旧仮名口語UniDic」に関して、「旧仮名遣いの口語文を対象とした形態素解析辞書」(https://t.co/6N1AqGuqFm)の当時は青空文庫と太陽コーパスで構築した模様 今もそうなのかな?(調査不足)
5 5 https://t.co/kxYIlsjTkn
「仮名遣」で検索して偶然発見した論文「旧仮名遣いの口語文を対象とした形態素解析辞書」 https://t.co/yfGOZItBbL を面白く読みました。歴史的仮名遣は曖昧検索や音声読み上げなどの機械処理が弱いと思ふんですが、かういふ研究も進められてゐると知って何だか安心です。

収集済み URL リスト