著者
福田 智子 駒木 敏 田坂 憲二 黒木 香 矢野 環 川崎 廣吉 竹田 正幸 波多野 賢治 岩坪 健 古瀬 雅義 藏中 さやか 三宅 真紀 西原 一江 日比野 浩信 南里 一郎 長谷川 薫
出版者
同志社大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

平安中期成立かといわれる類題和歌集『古今和歌六帖』約4500首を対象に、独自に開発した文字列解析システムを用いて、すべての和歌の出典考証を行った。また、複雑な書き入れに対応したテキストデータ作成のため、タグ付け規則を案出した。そして、六つの伝本のテキストファイルを作成した。それらを対象に、諸本の同一歌を横並びで比較対照でき、しかも、底本を自由に選択できる校本システムを開発した。さらに、伝本の原態、特殊な漢字表記、朱筆書き入れに関する基礎資料を作成した.
著者
玉利 公一 竹田 正幸 福田 智子 南里 一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.8, pp.81-88, 2000-01-21

本歌取りとは,特定の歌をふまえて新しい歌を作る作歌手法をいう.本歌取りの半自動抽出を行うための有効な方法として,まず,和歌間の類似性指標を定義し,その指標の値の大きい和歌の対を人手により検証する,といった方式が考えられる.このような方式においては,成功の鍵は,いかに類似性指標を定義するかにかかっている.著者らは,以前に最長共通部分列(LCS)の長さを用いた指標を変更することにより,新しい指標を提案し,それが本歌取りの半自動抽出に有効であることを示した.しかし,本歌取りには様々なふまえ方があるため,むしろ,研究者の視点に応じて指標を自由に変更でき,その都度,類似度の値の高い対を確認していく,というシナリオが有効であろう.本稿では,類似性指標を自由に設計するための共通の土俵となる統一的枠組みを提唱する.この枠組みでは,指標を,パターン集合とパターンにスコアを与える関数の対によって表し,二つの文字列間の類似度を,その共通パターンの最大スコアとして定義する.このため,このもとで設計したおのおのの指標は,直感的に把握しやすいという利点がある.本稿では,この枠組みのもとで,いくつかの指標を提示し,本歌取りの半自動抽出の観点から評価する.In this paper we consider a problem of semi-automatically finding instances of poetic allusion in a collection of classical Japanese poems. The key to success is how to define a similarity measure. We give a unifying framework that capture the essence of many existing measures. It makes it easy to design new measures appropriate to the problem. In this paper, we propose new measures and evaluate them.
著者
福田 智子 南里 一郎 竹田 正幸
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2002, no.8(2001-CH-053), pp.47-54, 2002-01-26

要旨.古典和歌データから同一文字列を2回以上含む歌を抽出し,その分析を行う.『万葉集』と,『古今集』から『新続古今集』までの勅撰集との,あわせて22の歌集に載る約40,000首から,5字以上の同一文字列が2回含まれる歌を48首抽出した.そして,それらの用例の,歌集ごとの分布状況や,表現効果の特質を考察した.その結果,『万葉集』に見られる7字の同一文字列反復が『古今集』には皆無であること,『新古今集』以降の勅撰集には5字以上の同一文字列反復の例はまずなく,唯一例外なのが『玉葉集』であることなどが,具体的に明らかになった.
著者
福田 智子 竹田 正幸 南里 一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.100, pp.49-56, 2000-10-27
被引用文献数
1

本稿では,任意の歌集間から類似歌を抽出することで,ある歌集の成立年代の推定へとつながった事例を報告する.これまで鎌倉時代中期の成立ではないかと考えられていた『為忠集』と,平安最末期以降の私家集(個人歌集)との間で,網羅的に類似歌の抽出を行ったところ,室町時代に成立した,正徹の『草根集』に,まとまった数の類似歌が拾い出せた.さらに,正徹の弟子である桜井基佐の『基佐集』に,『為忠集』に載る歌と同一の歌が見いだせた.『為忠集』に現れる人物の考証も併せて行ったところ,『為忠集』の成立を15世紀と推定することができた.This paper reports an applications of the method of automatically extracting similar poems we developed. We have compared Tametada-Shu, the mysterious anthology unidentified in Japanese literary history, with a number of private anthologies edited after the middle of the Kamakura period (the thirteenth-century) and found that there are several pairs of similar poems between Tametada-Shu and Sokon-Shu, an anthology by Shotetsu. The result suggests that the mysterious anthology was edited by a poet in the early Muromachi period (the fifteenth-century). There have been surmised dispute about the editing date since one scholar suggested the middle of Kamakura period as a probable one. We have had strong evidence about this problem.
著者
山崎 真由美 竹田 正幸 福田 智子 南里 一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.97, pp.57-64, 1998-10-23
被引用文献数
3

和歌文学研究において,歌の類似性の抽出は重要である.歌の類似性に着目することにより,過去や同時代の歌人による作品への影響を明らかにすることができ,また歌人の個性や時代による特徴を獲得することができる.従来,この類の研究は,任意の歌もしくは表現にまず注目し,次にその用例を収集するという方法で進められてきた.だがもし,大量の和歌のデータの中から類似歌を自動抽出することができれば,その類似歌の発見が契機となって新たな視点が得られ,研究の大きな進展につながることも期待できるのである.本論文では,大量の和歌データを対象に,計算機による類似歌の自動抽出を目指し,そのために必要な類似性の指標を提案する.提案した指標は,最長共通部分列に基づく指標を改善したものである.本方式を用いて,古今集と新古今集からの類似歌抽出を試みたところ,類似度の高いものの多くは,実際に本歌取りであり,また,主な注釈書には指摘が漏れている本歌取りも指摘できることが判明した.In this paper we consider a problem of automatically finding similar poems from a collection of classical Japanese poems. We propose two similarity measures, and show that they are superior to the similarity measure based on the longest common subsequence. We report successful results in finding similar poems between two imperial anthologies: KOKINSHU and SHINKOKINSHU
著者
福田 智子 矢野 環 田坂 憲二 岩坪 健 黒木 香 竹田 正幸 深川 大路 波多野 賢治 南里 一郎 宮崎 裕子 坂田 桂一 藤井 翔太
出版者
同志社大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

古今和歌六帖』と『源氏物語』を研究対象として校本システムを開発し、平安朝文学の伝本と表現に関する考察をおこなった。和歌用デジタル校本システムについては、伝本の墨付きの現状を、より論理的に表記するタグ付け規則を案出した。また、散文用校本作成支援ツールは、『源氏物語』の伝本4本のデータ処理をほぼ完了し、計算機を用いた異文箇所の数値化、およびSplits Treeによる本文系統の視覚化といった、本文異同を把握する一連の手法を確立した。