著者
石井 直樹 平石 智宣 延澤 志保 斎藤 博昭 中西 正和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.31, pp.23-30, 2000-06-02
参考文献数
8

日本語略語を復元するシステムについて報告する。このシステムは、任意の日本語略語に対して、新聞記事コーパス中の語句および辞書中の語句のうちから、いくつかの復元規則を用いて、元の語になると考えられるものを順位を付けて出力するものである。復元規則として、「元の語が略語内の文字を全て、同じ順で含むこと」、「略語と元の語を構成する字種が等しいこと」、「元の語の文字数が略語を構成する字数の4倍以内であること」、「略語内の文字が元の語の中で不連続的に含まれていること」といったことを定めた。用いる復元規則の数を変えながら404の略語に対して実験を行い、7割以上の確からしさで復元に成功した。