著者
土山 玄 村上 征勝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 人文科学とコンピュータ研究会報告
巻号頁・発行日
vol.2014, no.1, pp.1-6, 2014-01-18

本研究では,古典文学作品として著名な 『源氏物語』 と 『宇津保物語』 を分析対象とし,文の長さの分布を計量的に分析することで,両作品の各巻が作品別に分類されるのか検討を加えた.このような分析を行う背景に,欧米では古くは 19 世紀から文の長さを分析項目として,書き手の識別や同定を目的とした研究が行われていたが,その一方で,日本語で記述された文献については未だ十分に研究されていないことによる.本研究における分析の結果,文の長さの分布は日本語の文献においても,書き手の相違に起因すると考えられる文体的相違が認められた.
著者
土山 玄 村上 征勝
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.153-160, 2013-12-05

計量文献学において,研究対象となる文献の文体について統計的な手法を用い分類する研究は,従来から為されているが,現代文を対象とした研究に比べ古典文学作品を対象とした研究は十分に展開されているとは言えない.そこで本研究では,平安時代に著された『源氏物語』および『宇津保物語』を対象とし,語彙に関する情報を用い,作者の相違に起因すると考えられる文体的相違を明らかにし,両作品の諸巻を作品別に分類する.分析に用いた語彙に関する情報とは語の頻度,語の長さ,品詞構成比率,語彙の豊富さの4 つの指標である.分析の結果,これらの指標を単独に用いるのではなく,複合的に分析することで,両作品の文体的相違が顕著になる.
著者
村上 征勝 古瀬 順一
出版者
同志社大学
雑誌
萌芽研究
巻号頁・発行日
2002

本研究の目的は、精神的活動の変化を文体の変化として数量的に把握し、それによって精神的疾患や痴呆症の早期発見など、精神医学に役立てることが目的である。そのため、精神的疾患が原因で自殺したと考えられる作家、川端康成(S46.4.16,ガス自殺)、芥川龍之介(S2,7.24,睡眠薬服用)、三島由紀夫(S45.6.4,割腹)の3人の文章のデータベース化を試みた。特に、データベース化がある程度進んでいた川端康成に関し、彼の執筆活動の全時期にわたる文章の経年変化を調べることが必要と考え、「ちよ」(1919)、「篝火」(1924)、「浅草紅団」(1929),「名人」(1942),「古都」(1959)「隅田川」(1965)の6作品を新たに入力し、計量分析に必要となる単語認定、品詞認定等の作業を行った。この作業は16年度末までに終了できる見通しが立たなかったため、・読点の直前の文字の出現率・平均文長・会話文平均文長・全文に対する会話文の比率・ひらがな、カタカナの出現率の情報を用い、昨年までに入力済みの「伊豆の踊り子」(1926)などの7作品とあわせ、計13作品で分析を試みた。その結果、読点の直前の文字の出現率には、比較的早い時期の「篝火」,「浅草紅団」,「伊豆の踊り子」の3作品と、その後の作品にある程度違いが見られたものの、文章の変化を確認するには品詞情報などのほかの情報の分析が必要であることが判明した。そのため、本研究の研究期間内には行えなかったが、川端康成の13作品の品詞認定等の作業が終了次第、再分析を試みる。また、芥川龍之介、三島由紀夫の作品についてもデータベース化の作業を続け、川端康成と同様に計量分析する予定。
著者
浅野 晃 篠原 進 村上 征勝 西島 孜哉 谷脇 理史 冨士 昭雄
出版者
共立女子大学
雑誌
重点領域研究
巻号頁・発行日
1995

17世紀後半の作家井原西鶴の文学の魅力は、千変万化する語彙を縦横に操った新しい文体にあると言うことができる。処女作『好色一代男』(1682年刊)の冒頭部分「桜も散るに歎き、月は限りありて入佐山、友に但馬の国、かねほる里の辺りに‥‥」は、西鶴の個性的な文体の創造をみごとに示した好例である。ところが、現在、われわれは、西鶴語彙の索引を共有してはいない。本研究は、西鶴研究者が共同して、西鶴作品の語彙について、その統計分析のための基礎作業にとりくもうとしたものである。本年度の研究業績は、以下の2点にまとめることができる。(1)第1は、語彙をコンピュータ化するための実験、つまり、語彙を機械化するに当って、その可能な範囲を探る作業を開始したことである。まず、西鶴の代表作『好色一代男』『好色五人女』『日本永代蔵』をとり上げた。作品をデータ・ベース化し、研究会活動を通して、語彙の統計処理について、基本的な問題点を討議した。異体字や漢字の字体、仮名処理などの基本方針の方向を定め、コンピュータのいわゆる字書作りの作業に入ったのである。こうした作業と平行して、西鶴の全作品のデータ・ベース化の仕事も続行している。(2)第2の研究業績は、正確な西鶴作品を提供するための基礎作業に取りかかったことである。これは、最終的には、新しい『西鶴全集』の刊行に連なるものである。『定本西鶴全集』第1巻が世に出たのは、昭和26年8月のことであるから、それからすでに40数年の歳月が流れたことになる。現在の西鶴研究は、この全集を手懸りにして展開しているが、作品のテキスト研究も進歩を見せているので、現段階において、望みうる最高の西鶴全集と、西鶴語彙の総合索引を共有することになれば、西鶴研究はさらに大きな前進を見せることになろう。本研究は、以上の2つの分野において、基礎的な研究業績を築きはじめたものである。
著者
村上 征勝 上田 英代 今西 祐一郎 樺島 忠夫 藤田 真理 上田 裕一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.73, pp.33-38, 1996-07-26
被引用文献数
8

『源氏物語』の複数著者説や54巻の成立順序に関する疑問を、文章の統計分析という観点から解明しようと研究を行っている。この小論では、『源氏物語』の文体の安定性という観点から、特に後半の10巻の「宇治十帖」他作家説を中心に、いくつかの分析結果について報告する。One of the important questions regarding Genji Monogatari to the one concerning the author, that is, Murasaki Shikibu (Lady Murasaki) is the author of last ten volumes of Genji Monogatari. Another issue concerns the time sequence in which there 54 volumes were written. We are now trying to solve these questions by means of quantitative analysis of sentences. In this paper, we would like to present what has been derived from our study mainly in conjunction with the stability of the writing style of Murasaki Shikibu.