著者
新井 庭子 分寺 杏介 松崎 拓也 影浦 峡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-114, no.5, pp.1-8, 2017-05-06

テキストの難しさの研究として,既存の研究ではテキストか人間の認知の仕組みかどちらかしか研究対象にされてこなかった.本研究は,この 2 つの視点の両方を持ちつつ,主に知識構成を支える言語表現の形式に焦点を当て,小 ・ 中の理科教科書を材料にこの問題への接近を試みる.我々は,読みを困難にするテキストのパラメーターを予測し,小 ・ 中教科書テキストの間にそのパラメーターで表現できるギャップがあることを示したが,その研究はまた,表層的な特徴に加え,質的な観点から言語表現を検討する必要性を示した.本研究では,質的な関連から言語表現を特徴付けるカテゴリーとして,定義表現と分類の表現に着目し,計量的な分析を行った.
著者
蔡 東生 董 然 浅井 信吉
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.1, pp.1-3, 2015-05-09

ヒルベルトーファン変換 (Hilbert-Huang Transform:HHT) は,経験的モード分解により,信号を複数の固有モード関数に分解し,ヒルベルト変換をかけ,時間周波数特性を分析する.時間周波数特性への鋭敏性は,フーリエ変換,ウエーブレット変換より遥かに鋭敏で,本報告では,多変量 HHT を用い,パヒューム,能楽,文楽などの動作を,ワルツ,ヒップホップ,サルサなどの踊りと比較する.
著者
和氣 愛仁 宇陀 則彦 永崎 研宣 松村 敦
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.5, pp.1-4, 2013-07-27

筑波人文情報学研究会は,筑波大学人文社会系及び図書館情報メディア系の教員が中心となって立ち上げた研究グループである.資料の在り方に対して両極端の姿勢を持つ,人文学研究者と図書館情報学研究者のコラボレーションによって,人文情報学へ如何にアプローチしていくかを,本研究会のこれまでの活動報告を交えて議論する.The Tsukuba Research Group for the Digital Humanities is a research group that was started by members of the Faculty of Humanities and Social Sciences and the Faculty of Library, Information and Media Science. This paper will discuss approaches to the digital humanities through the collaboration of scholars in the humanities and in library and information science, who have views from opposite ends of the spectrum regarding data and what it should be. The discussion will include a report of the activities of this research group to date.
著者
香川 雅信
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.12, pp.1-3, 2014-07-26

サブカルチャーとしての 「妖怪文化」 は 18 世紀後半の都市で生み出されたが、それはある大きな 「誤解」 に基づくものであった。その 「誤解」 は、現在においても繰り返されている。"Yokai culture" as a subculture is produced in cities in the latter half of 18th century, which is based on a great misinterpretation. This misinterpretation is repeated even now.
著者
矢野 環
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.4, pp.1-8, 2013-07-27

AKB のシングル選抜総選挙は、今や 6 月の恒例行事となっている。メンバーの得票数を予想する様々な試みがなされている。講演者の方法は、2011,2012 年度上位 16 名、かつ 20 名の顔ぶれを的中させ、また 2013 年では 16 名中 15 名が的中であった。また、2012,2013 ともに上位 3 名は順序を含めて的中である。このようなシステムを考察する場合、特殊な分析手法をあれこれ使うよりも、データそのものをよく見ることが有効である、という良い例にもなっているのである。また、対象をよく知ることも重要である。それらを考慮した、実際の方法について解説する。Nowadays, the single selection general election of AKB serves as a routine occurrence in June. Various trials which expect a member's number of votes obtained are made. The lecturer's method made 16 and 20 persons' higher rank lineup guess right in the 2011-2012 fiscal year, and 15 persons were hits among 16 persons in 2013. Moreover, top three persons are hits, including the order in 2012-2013. When considering such a system, it is more effective to see the data itself than using specialized analytical method.
著者
土山 玄 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012-CH-94, no.5, pp.1-8, 2012-05-19

古くから他作者説が論じられている『源氏物語』の終わりの 10 巻である「宇治十帖」について,主成分分析およびランダムフォレストといった多変量解析を行い,「宇治十帖」 の作者とそれ以外の諸巻の作者が同一であるかについて,計量的な側面から検討を加える.本研究では,語の使用頻度に対し分析を行い,その結果,「宇治十帖」 の他作者説を支持する積極的な根拠は得られなかった.
著者
橋本 雄太
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-5, 2014-05-24

近年の電子書籍の普及にともない,複数の読者が読書を通して得た知見を共有するための 「ソーシャルリーディング」 と呼ばれる仕組みが注目を集めている.筆者は,ソーシャルリーディングの仕組みを歴史研究に応用する試みの一例として,近代デジタルライブラリー上の資料に対してソーシャルリーディングを実施するための環境である 「近デジリーダー」 を構築した.国立国会図書館によって運営される近代デジタルライブラリーは,明治期以降に刊行された 35 万点以上の図書・雑誌を擁する国内最大のデジタル・コレクションである.「近デジリーダー」 は,スマートフォン等のモバイルデバイス上でこれらの資料の閲覧を可能にすると同時に,資料の読解から得られた歴史学上の知見をメタデータとして蓄積し,利用者間で共有するための環境を提供する.This paper introduces a network-based system named Kindigi Reader, which is built upon Kindai Digital Library. Kindai Digital Library has over 350,000 documents published after Meiji era and is the largest digital collection in Japan. Kindigi Reader offers a series of features that realizes so-called "social reading" on those documents. The ultimate goal of Kindigi Reader is to provide facilities for historians to discover and make use of valuable historical resources available on Kindai Digital Library.
著者
小平 優衣 鈴木 啓史 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.8, pp.1-8, 2014-01-18

現在ディジタル環境でマンガを探すには,web 上の情報を参照するのが一般的である.タイトルや著者名などの書誌情報が利用される場合が多いが,マンガの内容や主題,キャラクタ等に関する情報も検索に利用されている.内容に即した検索を行うためには,マンガに関する情報を,マンガの何について説明している情報かを記述したデータとして利用できるようにする必要がある.また,これらの情報は一般的な語彙としてまとめられていないため利用することは難しく,情報共有を促進するためにはマンガの概念をディジタル上で機械が扱いやすくできるように形式化する必要がある.異なるマンガリソース間同士の参照や再利用,効率の良いリソースの生成を可能にするため,共通基盤となるマンガに関する情報を体系化し扱うことを可能にするオントロジーの構築を行った.構築のために Wikipedia のマンガに関するカテゴリ名を語彙として利用し,語彙同士の関係性を定義してオントロジーを構築し,マンガリソース同士を結びつけることで LOD として利用することを可能にした.構築したオントロジーは語彙の追加などの拡張が可能であり,マンガのあらゆる情報に繋げることが可能である.It is common for us to use information resources on the Web to find Manga in various genres. Bibliographic information such as author name and title are commonly used to find the resources. Other information such as subjects of the stories and leading characters and their genres, is obviously useful but not well organized in the current Web environment as commonly accepted vocabularies to present the contents of Manga. It is difficult to find a Web resource which provides a common vocabulary about Manga. In order to facilitate information sharing and to organize the information resources of Manga, we need a set of terms formally organized to represent fundamental concepts and instances of and about Manga. In this paper, we propose an ontology designed as a formal basis to organize information resources about Manga and to present instances representing concepts and entities included in or associated with a Manga. We build the ontology, which is named Manga Ontology, using the categories included in Wikipedia on the basic framework designed based on the Cinema Ontology[10]. Every instance included in the Manga Ontology is modelled based on the Resource Description Framework (RDF) in order to make the Manga metadata resources built on the ontology as a Linked Open Data (LOD) resource.
著者
王 一凡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.8, pp.1-4, 2015-05-09

大正新脩大蔵経所収 『一切経音義』 は,活字本でありながら多様な差異を有する膨大な異体字群を内包している.当資料を適切にデジタル化・UCS 符号化するためには,活字の異同を検討したうえで用字に関する体系的な理解を得る必要があるが,総字数 100 万字超,異なり活字約 3 万種と推定される本文を直接点検しながら,一貫性のある分析を行うことは困難である.したがって,活字の集計を省力化する手段が求められる.本報告では,オープンソースライブラリ OpenCV による自動処理を適用することでこれを実現する試みを紹介し,もって特定分野への汎用ライブラリの応用の可能性を提示する.
著者
矢野 環
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013-CH-99, no.4, pp.1-8, 2013-07-27

AKB のシングル選抜総選挙は、今や 6 月の恒例行事となっている。メンバーの得票数を予想する様々な試みがなされている。講演者の方法は、2011,2012 年度上位 16 名、かつ 20 名の顔ぶれを的中させ、また 2013 年では 16 名中 15 名が的中であった。また、2012,2013 ともに上位 3 名は順序を含めて的中である。このようなシステムを考察する場合、特殊な分析手法をあれこれ使うよりも、データそのものをよく見ることが有効である、という良い例にもなっているのである。また、対象をよく知ることも重要である。それらを考慮した、実際の方法について解説する。
著者
何 雯凌 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-8, 2014-01-18

書誌レコードの機能要件 (FRBR) の第 1 グループで定義される実体の概念を利用することで、マンガの探索がより容易になると考えられる。その一方で、マンガにおいては、FRBR の第 1 グループの概念が作品全体や、編などで表される作品を構成するストーリー、あるいはストーリーを構成するより小さな単位 (各話のエピソードや複数のページやコマで表現されるシーン) など様々に考えられる。本研究は、マンガの作品全体を単位とするとらえ方に加えて、ストーリー単位をとらえることで、探索を効率化することを目指し、書誌データからのストーリー単位の識別を目指す。しかし、マンガの書誌データの中にストーリー単位に関する情報は少ないため、機械的に抽出することは難しい。本研究では、Wikipedia の本文データを利用し、マンガ書誌データからストーリー単位を抽出する手法を提案した。京都国際マンガミュージアムに所蔵しているマンガの書誌データを用いた実験を行い、本手法の有効性を示した。この実験の結果から、本手法は利用した Wikipedia の情報の質に大きく影響されるとことが分かった。Manga - a Japanese term meaning graphic novels and comics - has been globally accepted. In Japan, there are a huge number of monographs and/or magazines for manga. Functional Requirements of Bibliographic Records (FRBR) provides useful concepts for readers to identify entities of manga, e.g., works of manga, expressions of manga, and so on. However, it is not clear which unit of manga those FRBR entities represent. They can be a whole manga or a story as a part of a manga, or even some smaller units of a manga (i.e. a single scene or an episode). This paper examines how to identify a manga work using a set of bibliographic records maintained by the Kyoto International Manga Museum. This study is aimed to identify a Work instance of manga, which may be a work as a series of stories or as a single story, in order to help readers find a comic book as an instance of a work. It is known that authority data is useful to identify works from bibliographic records. However, there is not enough information to identify a manga story in the bibliographic data. In this study, we used Wikipedia as a dictionary of manga to identify a manga story in the bibliographic records. The result of our experiment shows that using Wikipedia data is possible, but it also shows that the accuracy and efficiency depend on the quality of the Wikipedia data.
著者
山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015-CH-105, no.4, pp.1-6, 2015-01-24

本研究は,地域研究史資料を対象として,記述内容における時空間変化を追跡可能なデータ構造の確立を目指す.本報告では特に,本研究における地域研究史資料からのテキスト作成,テキストからの時空間情報の抽出・トピックの検出の各手法について述べる.
著者
田中 僚 芦川 大樹 松村 敦 宇陀 則彦
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.3, pp.1-4, 2014-07-26

近年,「デジタルアーカイブ」 という言葉は一般に浸透しつつあり,様々なデジタルアーカイブが公開されている.しかし,現在デジタルアーカイブという言葉は,単なるデジタル資料を保管・提供するサービスの総称として利用されることが多く,ここには,本来の意味での 「アーカイブズ」 の姿は見られない.本稿では現状のデジタルアーカイブの問題点を指摘するとともに,本来の 「アーカイブズ」 を反映したデジタルアーカイブの構想を提案する.Recently, various digital archives have been constructed, and the word "digital archive" generally circulated. However, the word digital archive is often used as a generic name of the services that only keeps and provides digital documents, and there is not the feature of "the archives" in the original meaning. In this paper, we point out problems of the present digital archive, and propose a design of the digital archive which reflected original "archives".
著者
上阪 彩香 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013-CH-98, no.4, pp.1-8, 2013-05-04

西鶴の著した作品は,日本文化の根幹をなす歴史的古典籍とされているが,没後320年になる今日においても西鶴作とされる浮世草子には,西鶴作かどうか疑惑が解明されていない作品も多く存在する.西鶴の第4遺稿集『万の文反古』も著者に関する疑惑が出されている作品のひとつである.本研究では,文章の計量的な分析により『万の文反古』の著者の疑問を検討する.
著者
高橋 洋成 永井 正勝 和氣 愛仁
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015, no.5, pp.1-5, 2015-01-24

近年のコンピュータとインターネットの発展に伴い,これまでコンピュータ上では転写テキストとして扱われることの多かった言語資料を,音声,動画,画像と一緒に保存・利用することが容易になった.著者らは古代エジプト神官文字文書,楔形文字粘土板資料,近代日本語文典資料などの文字資料を統一的に扱うための画像データベースと,World Wide Web 上のプラットフォームを構築している.さらに,本プラットフォームは次の 2 点を目指している.(1) 本プラットフォームの内部に格納された言語資料および研究データを,外部に保存し共有するために Text Encoding Initiative (TEI) を利用すること.(2) データの保存と共有をさらに促進させるために,言語資料と研究データに関する RDF トリプルを生成し,Linked Open Data (LOD) として提供すること.本稿はこの 2 点について,現在までの取り組みと具体例を報告する.Recent development of the internet and computer technologies makes it easier to compile various linguistic materials such as audios, videos and photos with their transliteration texts together. The authors are constructing the general-purpose image database and the platform on World Wide Web for the linguistic studies on hieratic texts of Ancient Egypt, cuneiform tablets of Ancient Orient, and Modern Japanese Grammar Textbooks. The platform aims on the following two points: (1) to use Text Encoding Initiative (TEI) for preservation and sharing of the internal data with its outer world, (2) to create sharable RDF triples from the data to provide them as Linked Open Data (LOD). The current snapshot of the developing platform will be discussed.
著者
田中 良典 井出 明
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2011, no.10, pp.1-8, 2011-05-14

本研究は、大学生の観光ニーズを推定することを目的としている。実験として、大学生に対し、希望する旅行についての自由記述アンケートとライフスタイル調査を実施した上で、得られたデータを元に、テキストマイニング分析をおこなった。その結果、属性ごとで特徴的な語や対応分析から、女性は歴史好きな層を中心に世界遺産をゆっくり巡る旅行、男性は理系が一人旅、文系は個人ツアーを好むなど具体的な観光ニーズを推定することが出来た。The purpose of this research is to seek for needs of tourism among university students. We firstly conducted a free writing questionnaire and survey about the lifestyle of university students and then conducted text-mining analysis. From the analysis, we have discovered some interesting features that depended on personal attribution. For example, "Women, who love history, are fond of slow travels to see the world heritages," "Male science course students like to travel alone," and "Arts students choose personal tours" were some of the interesting inclinations obtained from the analysis.
著者
守岡知彦
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.3, pp.1-6, 2013-01-18

「CHISE IDS 漢字検索」 や 「東洋学文献類目データベース Ver.7」 の詳細画面表示に用いている "EST" に対して RDF/XML 形式での出力機能の追加を試みた。ここでは階層的素性名の RDF/XML における述語へのマッピングに焦点を当てて概説する。
著者
北﨑 勇帆
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.5, pp.1-6, 2015-05-09

洒落本は,近世期に刊行された小説の一形態であり,近世日本語の口語資料としての有用性が高い.この洒落本には,書名や話の粗筋を同一にしながら,江戸板・上方板で内容や語彙に異同のある作品が存在する.上方で刊行されたものが後に江戸で改作された 『月花余情』 組と,江戸で刊行されたものが後に上方で刊行された 『郭中奇譚』 組である.本稿ではそのような江戸・上方間で改作が行われた洒落本のテキストを TEI P5 に準拠してマークアップすることにより,当時の東西言語の比較資料として用いることができる対照コーパスを構築した.
著者
山田 太造 古瀬 蔵 安達 文夫
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.9, pp.1-8, 2012-10-05

人間文化研究機構は,人文科学研究資源を一元的かつ網羅的に活用できる環境を目的として nihuINT を構築した.本稿では,人文科学研究資源から利用者が求める検索結果を得るための探索支援の方法について述べる.In order to construct an environment where research resources of humanities can be leveraged centrally and comprehensived, National Institutes for the Humanities (NIHU) have developed an integrated retrieval system called nihuINT. In this paper we describe a method of an exploring support which enables a user to obtain from the resources.
著者
村上浩介
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-2, 2014-10-11

国立国会図書館では,平成 21(2009) 年度から平成 24(2012) 年度にかけて SP レコードのデジタル音源約 4.9 万点を収集し,現在,「歴史的音源 (れきおん)」 のサービス名称で提供している.このサービスについて,概要を紹介する.