著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.28, no.2, pp.85-96, 2018-05-26 (Released:2018-06-08)
参考文献数
13

本稿は,2017年の第25回情報知識学会年次大会において発表した「和歌集における計量分析と機械学習による判別」の続編としての研究報告である.分析対象は,鎌倉時代初期から室町時代中期までの「十三代集」と呼ばれている勅撰和歌集である.前回の発表は「八代集」であり,これで勅撰和歌集「二十一代集」の計測を完了するものである. 分析手法としては前回の研究と同様の計測を行うものである.具体的には,和歌集間での品詞使用率の統計的な差や,また季節歌と恋歌に関して名詞率とMVRとを調査し,そして同様にNaïve Bayesにより判別を試みた.さらに,この時代は武士政権の時代であるために,「武士歌」もより多く選抜されてきている.その「武士歌」についての特徴について主成分分析法による計測を試みるもので ある.
著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.26, no.2, pp.152-157, 2016-05-14 (Released:2016-07-15)
参考文献数
16

本稿では、中世古典文学の数作品について「係り結び」を構成する係助詞の頻度を計測し、それをベースにテキストマイニングを試みた。統計的手法としては、比率の検定、主成分分析、クラスター分析、判別分析を行った。「係り結び」は鎌倉・室町時代あたりから衰退が起こってきているということが定説であり、本稿の作品群においても、時代を追ってその傾向が見られる[1][2]。さらに、その作品間での差を段単位での係助詞の頻度により調査した。その結果、「宇治拾遺物語」は他の作品とは差があるという傾向が見受けられた。
著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.28, no.2, pp.85-96, 2018

<p> 本稿は,2017年の第25回情報知識学会年次大会において発表した「和歌集における計量分析と機械学習による判別」の続編としての研究報告である.分析対象は,鎌倉時代初期から室町時代中期までの「十三代集」と呼ばれている勅撰和歌集である.前回の発表は「八代集」であり,これで勅撰和歌集「二十一代集」の計測を完了するものである.<br/> 分析手法としては前回の研究と同様の計測を行うものである.具体的には,和歌集間での品詞使用率の統計的な差や,また季節歌と恋歌に関して名詞率とMVRとを調査し,そして同様にNaïve Bayesにより判別を試みた.さらに,この時代は武士政権の時代であるために,「武士歌」もより多く選抜されてきている.その「武士歌」についての特徴について主成分分析法による計測を試みるもので ある.</p>
著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.27, no.2, pp.133-143, 2017-05-27 (Released:2017-07-21)
参考文献数
11
被引用文献数
1

本稿は,テキストマイニングの一環として,中世を代表する文学である和歌についてアプローチを試みたものである.分析対象は,平安中期から鎌倉時代初期までの「八代集」と呼ばれている勅撰和歌集である.これらの和歌の形態素での計量分析を行い,「八代集」の違いについて考察を行った.分析手法としては和歌集間での品詞使用率の統計的な差や,特に季節歌と恋歌に関して,冨士池優美氏が行っている名詞率とMVRの関係を用いた手法により,和歌集における差を調査した.そして,その結果を用いて,機械学習の手法の一つであるNaïve-Bayesにより判別を試みた.結果は,若干の程度の差はあれ判別をすることは困難であった.しかるに,和歌集の季節歌・恋歌などの部立別データにおいては,特に「後撰集」が高い判別であった.このことより,「後撰集」は「八代集」の中で異質な存在であるのかも知れないと思われる.
著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌
巻号頁・発行日
vol.27, no.2, pp.133-143, 2017
被引用文献数
1

<p> 本稿は,テキストマイニングの一環として,中世を代表する文学である和歌についてアプローチを試みたものである.分析対象は,平安中期から鎌倉時代初期までの「八代集」と呼ばれている勅撰和歌集である.これらの和歌の形態素での計量分析を行い,「八代集」の違いについて考察を行った.分析手法としては和歌集間での品詞使用率の統計的な差や,特に季節歌と恋歌に関して,冨士池優美氏が行っている名詞率とMVRの関係を用いた手法により,和歌集における差を調査した.そして,その結果を用いて,機械学習の手法の一つであるNaïve-Bayesにより判別を試みた.結果は,若干の程度の差はあれ判別をすることは困難であった.しかるに,和歌集の季節歌・恋歌などの部立別データにおいては,特に「後撰集」が高い判別であった.このことより,「後撰集」は「八代集」の中で異質な存在であるのかも知れないと思われる.</p>
著者
深澤 克朗 沢登 千恵子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.26, no.2, pp.152-157, 2016

本稿では、中世古典文学の数作品について「係り結び」を構成する係助詞の頻度を計測し、それをベースにテキストマイニングを試みた。統計的手法としては、比率の検定、主成分分析、クラスター分析、判別分析を行った。「係り結び」は鎌倉・室町時代あたりから衰退が起こってきているということが定説であり、本稿の作品群においても、時代を追ってその傾向が見られる[1][2]。さらに、その作品間での差を段単位での係助詞の頻度により調査した。その結果、「宇治拾遺物語」は他の作品とは差があるという傾向が見受けられた。