著者
大出 彩 松本 文子 金子 貴昭
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.103-110, 2013-12-05

本研究では,日本レコード大賞及び優秀作品賞を受賞した楽曲の歌詞について計量テキスト分析を行った.1978年から2012年に発表された全344曲の年代ごとに表れる歌詞の変化を読み取った結果,全年代を通してラブソングが流行する傾向にあると分かった.また,1990年代後半から2000年代にかけてネガティブな内容からポジティブな内容への変化が見られ,1997年が変化の境界になっていることが分かった.その要因には当時の社会背景が関係しており,失業率の増加や凶悪犯罪の増加などから人々の社会に対する不安が増大したこと,流行の発信者が若者へと移行していったことが影響していると考えられる.
著者
永崎 研宣 三宅 真紀 苫米地 等流 A.CharlesMuller 下田 正弘
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.239-246, 2013-12-05

本稿は、大正新脩大藏經テキストデータベースにおける脚注の校勘情報を通じた人文学資料としてのテクスト構造化に関する研究を扱う。これはこのデータベースを構築・運用するSAT プロジェクトの次のフェーズの方針の策定に役立てることを目指すものである。大正新脩大藏經の校勘情報は、各一次資料の歴史的な関係からある程度想定可能だが、具体的に研究されてきたわけではなかった。ここでは、デジタル化された校勘情報を用いた分析を行ったが、結果は一般的な想定を裏付けするものであった。いくつかの例外的なものがあったことが、今後の方針を策定する上で有益かもしれない。また、Linked Data という形で校勘情報を扱うことで、一次資料公開に関する権利所有者との合意形成が容易になるかもしれない。
著者
大出 彩 松本 文子 金子 貴昭
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.103-110, 2013-12-05
著者
後藤 真 内藤 求
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.79-86, 2013-12-05

筆者らは,正倉院文書トピックマップの開発について,以前に報告を行った.その後も開発と拡張・情報の充実を進めている.知識情報を経典に関するものを中心に充実させた.正倉院文書の中心は写経所の文書であり,経典の情報の充実は正倉院文書の中心部分の研究に役立つことになる.知識情報の充実と,その抽出・可視化の手法によって,奈良時代の経典の所在や,所属の状況を明らかにできるようシステムを作った.また,正倉院文書データベース(SOMODA)の新たなバージョンとしての位置づけも加えられるよう,文書に関する情報も充実させ,より高度な情報派遣を可能にするものとした.
著者
佐藤 貴文 後藤 真 木村 文則 前田 亮
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.57-64, 2013-12-05

本稿では,遠隔地にいる複数の人文系研究者によって,文献資料に関する注釈情報を共同で入力するためのWebシステムの試作について述べる.本研究で対象とする文献は『東大寺要録』という歴史資料であり,これに対して注釈作業を行っている人文系研究者による利用を想定している.本システムの特徴として,複数の研究者が同一の史料に対して同時に注釈の付与が可能である点,複数の研究者による注釈が部分的に重なる場合や,離れた文字にまとめて注釈を付与するなど,複雑に入り組んだ注釈への対応を考慮している点が挙げられる.本発表では,実際に利用する人文系研究者の意見を得ながら進めている本システムの構築について,現状の報告および今後の展望について述べる.
著者
土山 玄 村上 征勝
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.153-160, 2013-12-05

計量文献学において,研究対象となる文献の文体について統計的な手法を用い分類する研究は,従来から為されているが,現代文を対象とした研究に比べ古典文学作品を対象とした研究は十分に展開されているとは言えない.そこで本研究では,平安時代に著された『源氏物語』および『宇津保物語』を対象とし,語彙に関する情報を用い,作者の相違に起因すると考えられる文体的相違を明らかにし,両作品の諸巻を作品別に分類する.分析に用いた語彙に関する情報とは語の頻度,語の長さ,品詞構成比率,語彙の豊富さの4 つの指標である.分析の結果,これらの指標を単独に用いるのではなく,複合的に分析することで,両作品の文体的相違が顕著になる.
著者
山田 太造 野村 朋弘 井上 聡
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.145-152, 2013-12-05

本論文では,日本南北朝期史料についてテキストを用いた分類および関連史料提示の手法について述べる.史料分類では潜在的トピックを用いる.潜在的トピックを検出するにあたりLDA(Latent Dirichlet Allocation)と呼ばれるトピックモデルを用いる.また,対象史料における潜在的トピックの状態,および史料間の関連について述べる.さらに,潜在的トピックを用いた関連史料提示手法について示す.
著者
ホドシチェク ボル 山元 啓史
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.21-26, 2013-12-05

本研究は、現代日本語コーパスにおける中間語彙層の役割に焦点を当てその応用について示すものである。ここでいう中間語彙層とは、個々の単語の情報量を計算し、その情報量の序列において中間に位置する語彙である。一般的には、序列として使用頻度が用いられているが、本研究では各単語が持つ情報量の分布を用いる。頻度の高い語は機能語が多く、文の構造や語の係り受けを明示するが、内容としての情報量は少ない。一方、頻度の低い語は、トピック・内容をよく表した語か、珍しい語、固有名詞などである。頻度の低い語を利用すると領域毎に特化された情報が顕著になるあまり、共有語彙が少なくなり、文書間の比較や時系列の変動が分析しにくくなる。中間語彙は上記の2つの問題点について相互比較、時系列比較を可能にする語彙集合である。本稿ではその抽出の手法と応用例について述べる。
著者
小林 雄一郎 阿部 真理子 成田 真澄
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.89-96, 2013-12-05

本研究の目的は,英語学習者のライティングにおける書き手の習熟度と母語が第2 言語ライティングに与える影響を調査することである。具体的には,東アジア圏(香港,韓国,台湾,日本)の大学生によって書かれた英作文コーパスにおける58 種類の言語項目(語彙,品詞,統語,談話など)を分析対象とした。その結果,香港人学習者と日本人学習者に関しては,習熟度による影響よりも母語による影響の方が大きいことが示唆された。また,韓国人学習者と台湾人学習者に関しては,母語による影響よりも習熟度による影響の方が大きいことが分かった。