著者
塚越 柚季
雑誌
じんもんこん2018論文集
巻号頁・発行日
vol.2018, pp.9-14, 2018-11-24

サンスクリットの文中の単語に自動で形態情報を付与するのは容易ではない.文中の語形 (主に語尾) は,連 声規則により主に後続する語の語頭の音によって変化する.このため,手を加えていないテキストに対する形 態情報の付与が難しい.そこで連声規則が適用されている原典テキストから,連声規則前の形の単語の連続に 戻すことが必要である.時間を要するが,語彙や形態の情報を元に連声を解除することは可能である.一方でそのような情報なしに Attention メカニズム + sequence to sequence モデルを用いて短時間に高精度で連声の解除にも成功している. 本研究では Attention のみを使って高い精度を出すことができる Transformer モデルを用いて,高精度な連声の解除を行った.