- 著者
-
玉利 公一
竹田 正幸
福田 智子
南里 一郎
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
- 巻号頁・発行日
- vol.2000, no.8, pp.81-88, 2000-01-21
本歌取りとは,特定の歌をふまえて新しい歌を作る作歌手法をいう.本歌取りの半自動抽出を行うための有効な方法として,まず,和歌間の類似性指標を定義し,その指標の値の大きい和歌の対を人手により検証する,といった方式が考えられる.このような方式においては,成功の鍵は,いかに類似性指標を定義するかにかかっている.著者らは,以前に最長共通部分列(LCS)の長さを用いた指標を変更することにより,新しい指標を提案し,それが本歌取りの半自動抽出に有効であることを示した.しかし,本歌取りには様々なふまえ方があるため,むしろ,研究者の視点に応じて指標を自由に変更でき,その都度,類似度の値の高い対を確認していく,というシナリオが有効であろう.本稿では,類似性指標を自由に設計するための共通の土俵となる統一的枠組みを提唱する.この枠組みでは,指標を,パターン集合とパターンにスコアを与える関数の対によって表し,二つの文字列間の類似度を,その共通パターンの最大スコアとして定義する.このため,このもとで設計したおのおのの指標は,直感的に把握しやすいという利点がある.本稿では,この枠組みのもとで,いくつかの指標を提示し,本歌取りの半自動抽出の観点から評価する.In this paper we consider a problem of semi-automatically finding instances of poetic allusion in a collection of classical Japanese poems. The key to success is how to define a similarity measure. We give a unifying framework that capture the essence of many existing measures. It makes it easy to design new measures appropriate to the problem. In this paper, we propose new measures and evaluate them.