著者
新井 庭子 分寺 杏介 松崎 拓也 影浦 峡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-114, no.5, pp.1-8, 2017-05-06

テキストの難しさの研究として,既存の研究ではテキストか人間の認知の仕組みかどちらかしか研究対象にされてこなかった.本研究は,この 2 つの視点の両方を持ちつつ,主に知識構成を支える言語表現の形式に焦点を当て,小 ・ 中の理科教科書を材料にこの問題への接近を試みる.我々は,読みを困難にするテキストのパラメーターを予測し,小 ・ 中教科書テキストの間にそのパラメーターで表現できるギャップがあることを示したが,その研究はまた,表層的な特徴に加え,質的な観点から言語表現を検討する必要性を示した.本研究では,質的な関連から言語表現を特徴付けるカテゴリーとして,定義表現と分類の表現に着目し,計量的な分析を行った.
著者
蔡 東生 董 然 浅井 信吉
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.1, pp.1-3, 2015-05-09

ヒルベルトーファン変換 (Hilbert-Huang Transform:HHT) は,経験的モード分解により,信号を複数の固有モード関数に分解し,ヒルベルト変換をかけ,時間周波数特性を分析する.時間周波数特性への鋭敏性は,フーリエ変換,ウエーブレット変換より遥かに鋭敏で,本報告では,多変量 HHT を用い,パヒューム,能楽,文楽などの動作を,ワルツ,ヒップホップ,サルサなどの踊りと比較する.
著者
香川 雅信
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.12, pp.1-3, 2014-07-26

サブカルチャーとしての 「妖怪文化」 は 18 世紀後半の都市で生み出されたが、それはある大きな 「誤解」 に基づくものであった。その 「誤解」 は、現在においても繰り返されている。"Yokai culture" as a subculture is produced in cities in the latter half of 18th century, which is based on a great misinterpretation. This misinterpretation is repeated even now.
著者
和氣 愛仁 宇陀 則彦 永崎 研宣 松村 敦
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.5, pp.1-4, 2013-07-27

筑波人文情報学研究会は,筑波大学人文社会系及び図書館情報メディア系の教員が中心となって立ち上げた研究グループである.資料の在り方に対して両極端の姿勢を持つ,人文学研究者と図書館情報学研究者のコラボレーションによって,人文情報学へ如何にアプローチしていくかを,本研究会のこれまでの活動報告を交えて議論する.The Tsukuba Research Group for the Digital Humanities is a research group that was started by members of the Faculty of Humanities and Social Sciences and the Faculty of Library, Information and Media Science. This paper will discuss approaches to the digital humanities through the collaboration of scholars in the humanities and in library and information science, who have views from opposite ends of the spectrum regarding data and what it should be. The discussion will include a report of the activities of this research group to date.
著者
矢野 環
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.4, pp.1-8, 2013-07-27

AKB のシングル選抜総選挙は、今や 6 月の恒例行事となっている。メンバーの得票数を予想する様々な試みがなされている。講演者の方法は、2011,2012 年度上位 16 名、かつ 20 名の顔ぶれを的中させ、また 2013 年では 16 名中 15 名が的中であった。また、2012,2013 ともに上位 3 名は順序を含めて的中である。このようなシステムを考察する場合、特殊な分析手法をあれこれ使うよりも、データそのものをよく見ることが有効である、という良い例にもなっているのである。また、対象をよく知ることも重要である。それらを考慮した、実際の方法について解説する。Nowadays, the single selection general election of AKB serves as a routine occurrence in June. Various trials which expect a member's number of votes obtained are made. The lecturer's method made 16 and 20 persons' higher rank lineup guess right in the 2011-2012 fiscal year, and 15 persons were hits among 16 persons in 2013. Moreover, top three persons are hits, including the order in 2012-2013. When considering such a system, it is more effective to see the data itself than using specialized analytical method.
著者
土山 玄 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012-CH-94, no.5, pp.1-8, 2012-05-19

古くから他作者説が論じられている『源氏物語』の終わりの 10 巻である「宇治十帖」について,主成分分析およびランダムフォレストといった多変量解析を行い,「宇治十帖」 の作者とそれ以外の諸巻の作者が同一であるかについて,計量的な側面から検討を加える.本研究では,語の使用頻度に対し分析を行い,その結果,「宇治十帖」 の他作者説を支持する積極的な根拠は得られなかった.
著者
橋本 雄太
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-5, 2014-05-24

近年の電子書籍の普及にともない,複数の読者が読書を通して得た知見を共有するための 「ソーシャルリーディング」 と呼ばれる仕組みが注目を集めている.筆者は,ソーシャルリーディングの仕組みを歴史研究に応用する試みの一例として,近代デジタルライブラリー上の資料に対してソーシャルリーディングを実施するための環境である 「近デジリーダー」 を構築した.国立国会図書館によって運営される近代デジタルライブラリーは,明治期以降に刊行された 35 万点以上の図書・雑誌を擁する国内最大のデジタル・コレクションである.「近デジリーダー」 は,スマートフォン等のモバイルデバイス上でこれらの資料の閲覧を可能にすると同時に,資料の読解から得られた歴史学上の知見をメタデータとして蓄積し,利用者間で共有するための環境を提供する.This paper introduces a network-based system named Kindigi Reader, which is built upon Kindai Digital Library. Kindai Digital Library has over 350,000 documents published after Meiji era and is the largest digital collection in Japan. Kindigi Reader offers a series of features that realizes so-called "social reading" on those documents. The ultimate goal of Kindigi Reader is to provide facilities for historians to discover and make use of valuable historical resources available on Kindai Digital Library.
著者
高橋 洋成 永崎 研宣 本間 淳
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2022-CH-129, no.3, pp.1-7, 2022-05-14

動画アノテーションツール ELAN で作成された「注釈付き動画」を言語教育の教材として活用するため,本研究は IIIF ビューワ「Mirador 動画アノテーション対応版」を改良し,注釈テキストの自動スクロール機能や字幕表示機能を追加した.また,ELAN の注釈データを IIIF 記述へ変換するにあたり,副産物として様々な形式のデータを得ることができ,多様なプラットフォームを見据えた注釈テキストの「エコシステム」構築の可能性が示された.
著者
上椙 英之 上椙 真之 多仁 照廣
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.6, pp.1-6, 2012-10-05

石造遺物表面の文字情報を取得するため,先ず斜光撮影画像を複数枚用意する.次にその差分を採ることで,色情報を削除し,残った凹凸の陰影を合成することにより通常撮影では判別が困難な文字情報を効率よく取得することが可能となった.In this paper, we propose a new technique for the imaging of the characters on the surface of stone monuments. We acquired images of a stone monument illuminating from different directions, and reconstructed a new image by differentiating and integrating the source images. Using the reconstructed image, we can identify the characters without the stone monuments being damaged.
著者
小平 優衣 鈴木 啓史 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.8, pp.1-8, 2014-01-18

現在ディジタル環境でマンガを探すには,web 上の情報を参照するのが一般的である.タイトルや著者名などの書誌情報が利用される場合が多いが,マンガの内容や主題,キャラクタ等に関する情報も検索に利用されている.内容に即した検索を行うためには,マンガに関する情報を,マンガの何について説明している情報かを記述したデータとして利用できるようにする必要がある.また,これらの情報は一般的な語彙としてまとめられていないため利用することは難しく,情報共有を促進するためにはマンガの概念をディジタル上で機械が扱いやすくできるように形式化する必要がある.異なるマンガリソース間同士の参照や再利用,効率の良いリソースの生成を可能にするため,共通基盤となるマンガに関する情報を体系化し扱うことを可能にするオントロジーの構築を行った.構築のために Wikipedia のマンガに関するカテゴリ名を語彙として利用し,語彙同士の関係性を定義してオントロジーを構築し,マンガリソース同士を結びつけることで LOD として利用することを可能にした.構築したオントロジーは語彙の追加などの拡張が可能であり,マンガのあらゆる情報に繋げることが可能である.It is common for us to use information resources on the Web to find Manga in various genres. Bibliographic information such as author name and title are commonly used to find the resources. Other information such as subjects of the stories and leading characters and their genres, is obviously useful but not well organized in the current Web environment as commonly accepted vocabularies to present the contents of Manga. It is difficult to find a Web resource which provides a common vocabulary about Manga. In order to facilitate information sharing and to organize the information resources of Manga, we need a set of terms formally organized to represent fundamental concepts and instances of and about Manga. In this paper, we propose an ontology designed as a formal basis to organize information resources about Manga and to present instances representing concepts and entities included in or associated with a Manga. We build the ontology, which is named Manga Ontology, using the categories included in Wikipedia on the basic framework designed based on the Cinema Ontology[10]. Every instance included in the Manga Ontology is modelled based on the Resource Description Framework (RDF) in order to make the Manga metadata resources built on the ontology as a Linked Open Data (LOD) resource.
著者
矢野 環
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013-CH-99, no.4, pp.1-8, 2013-07-27

AKB のシングル選抜総選挙は、今や 6 月の恒例行事となっている。メンバーの得票数を予想する様々な試みがなされている。講演者の方法は、2011,2012 年度上位 16 名、かつ 20 名の顔ぶれを的中させ、また 2013 年では 16 名中 15 名が的中であった。また、2012,2013 ともに上位 3 名は順序を含めて的中である。このようなシステムを考察する場合、特殊な分析手法をあれこれ使うよりも、データそのものをよく見ることが有効である、という良い例にもなっているのである。また、対象をよく知ることも重要である。それらを考慮した、実際の方法について解説する。
著者
上阪 彩香 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2011-CH-90, no.2, pp.1-7, 2011-05-14

江戸時代前期の作家井原西鶴 (1642?~1693) の手によるものとされる作品は多数残されているが,西鶴作品には様々な問題が提起されてきた.しかし,現在まで計量文献学の観点から検討された研究はない.本研究では品詞の出現率と助動詞の出現率を主成分分析で分析し,①『好色一代男』 だけが西鶴の著作とする説②西鶴工房説③遺稿集が弟子によって補作や修正されたという 3 つの説の検証を試みた.
著者
佐治 奈通子 中村 覚
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2019-CH-120, no.11, pp.1-7, 2019-05-04

本発表では,歴史学と情報学の協働による,史料画像データ整理の実践事例を示す.具体的には,歴史史料から得られる情報を整理・分析可能な史料研究支援システムを利用して,ボスニアのカトリック修道院所蔵の未整理のオスマン ・ トルコ語文書の画像データ 2,268 点を整理する.その作業を通じて,歴史学的な観点からのニーズを反映させたシステムの改良を試みた.また,個々のデータ詳述と,可視化による史料群の全体像の把握が可能となったことで,作業の効率化とバランスのよい史料理解に繋がった.
著者
王 一凡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.8, pp.1-4, 2015-05-09

大正新脩大蔵経所収 『一切経音義』 は,活字本でありながら多様な差異を有する膨大な異体字群を内包している.当資料を適切にデジタル化・UCS 符号化するためには,活字の異同を検討したうえで用字に関する体系的な理解を得る必要があるが,総字数 100 万字超,異なり活字約 3 万種と推定される本文を直接点検しながら,一貫性のある分析を行うことは困難である.したがって,活字の集計を省力化する手段が求められる.本報告では,オープンソースライブラリ OpenCV による自動処理を適用することでこれを実現する試みを紹介し,もって特定分野への汎用ライブラリの応用の可能性を提示する.
著者
何 雯凌 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-8, 2014-01-18

書誌レコードの機能要件 (FRBR) の第 1 グループで定義される実体の概念を利用することで、マンガの探索がより容易になると考えられる。その一方で、マンガにおいては、FRBR の第 1 グループの概念が作品全体や、編などで表される作品を構成するストーリー、あるいはストーリーを構成するより小さな単位 (各話のエピソードや複数のページやコマで表現されるシーン) など様々に考えられる。本研究は、マンガの作品全体を単位とするとらえ方に加えて、ストーリー単位をとらえることで、探索を効率化することを目指し、書誌データからのストーリー単位の識別を目指す。しかし、マンガの書誌データの中にストーリー単位に関する情報は少ないため、機械的に抽出することは難しい。本研究では、Wikipedia の本文データを利用し、マンガ書誌データからストーリー単位を抽出する手法を提案した。京都国際マンガミュージアムに所蔵しているマンガの書誌データを用いた実験を行い、本手法の有効性を示した。この実験の結果から、本手法は利用した Wikipedia の情報の質に大きく影響されるとことが分かった。Manga - a Japanese term meaning graphic novels and comics - has been globally accepted. In Japan, there are a huge number of monographs and/or magazines for manga. Functional Requirements of Bibliographic Records (FRBR) provides useful concepts for readers to identify entities of manga, e.g., works of manga, expressions of manga, and so on. However, it is not clear which unit of manga those FRBR entities represent. They can be a whole manga or a story as a part of a manga, or even some smaller units of a manga (i.e. a single scene or an episode). This paper examines how to identify a manga work using a set of bibliographic records maintained by the Kyoto International Manga Museum. This study is aimed to identify a Work instance of manga, which may be a work as a series of stories or as a single story, in order to help readers find a comic book as an instance of a work. It is known that authority data is useful to identify works from bibliographic records. However, there is not enough information to identify a manga story in the bibliographic data. In this study, we used Wikipedia as a dictionary of manga to identify a manga story in the bibliographic records. The result of our experiment shows that using Wikipedia data is possible, but it also shows that the accuracy and efficiency depend on the quality of the Wikipedia data.
著者
山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015-CH-105, no.4, pp.1-6, 2015-01-24

本研究は,地域研究史資料を対象として,記述内容における時空間変化を追跡可能なデータ構造の確立を目指す.本報告では特に,本研究における地域研究史資料からのテキスト作成,テキストからの時空間情報の抽出・トピックの検出の各手法について述べる.
著者
田中 僚 芦川 大樹 松村 敦 宇陀 則彦
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.3, pp.1-4, 2014-07-26

近年,「デジタルアーカイブ」 という言葉は一般に浸透しつつあり,様々なデジタルアーカイブが公開されている.しかし,現在デジタルアーカイブという言葉は,単なるデジタル資料を保管・提供するサービスの総称として利用されることが多く,ここには,本来の意味での 「アーカイブズ」 の姿は見られない.本稿では現状のデジタルアーカイブの問題点を指摘するとともに,本来の 「アーカイブズ」 を反映したデジタルアーカイブの構想を提案する.Recently, various digital archives have been constructed, and the word "digital archive" generally circulated. However, the word digital archive is often used as a generic name of the services that only keeps and provides digital documents, and there is not the feature of "the archives" in the original meaning. In this paper, we point out problems of the present digital archive, and propose a design of the digital archive which reflected original "archives".
著者
上阪 彩香 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013-CH-98, no.4, pp.1-8, 2013-05-04

西鶴の著した作品は,日本文化の根幹をなす歴史的古典籍とされているが,没後320年になる今日においても西鶴作とされる浮世草子には,西鶴作かどうか疑惑が解明されていない作品も多く存在する.西鶴の第4遺稿集『万の文反古』も著者に関する疑惑が出されている作品のひとつである.本研究では,文章の計量的な分析により『万の文反古』の著者の疑問を検討する.
著者
永崎 研宣 青池 亨 本間 淳
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2022-CH-129, no.13, pp.1-3, 2022-05-14

現在のデジタルアーカイブの多くは,実物をデジタル撮影した画像を掲載している.そのなかでは,現物のサイズを確認できるように定規を画像に写し込んでいるものが多く見られる.これは目視でサイズを想定しながらデジタル化資料を閲覧する際にはきわめて有用である.一方,関連のある複数の画像を対比したり重ねて透過したりすることは,デジタルアーカイブに搭載されたコンテンツの利活用方法として有効であるものの,この場合には,この画像中の定規は,目視でサイズをあわせるべく画像を縮小拡大しながら調整する際の参考情報でしかなかった.そこで,筆者らは,二つの画像に写し込まれたそれぞれの定規を画像認識によって比較し,画像サイズを自動的に調整するモデルを考案し,それに沿った実装を開発した.本発表では,このモデルと実装について報告し,今後の課題を提示する.
著者
永井 正勝 和氣 愛仁 高橋 洋成
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2019-CH-119, no.14, pp.1-7, 2019-02-09

一般言語学的なスタンスで様々な時代や地域の言語を統一的に扱おうとした場合に,どのような言語学的データの整理の仕方が必要なのかという観点は,データベース構築の際のプラクティカルな問題であると同時に,その整理行為そのものが,言語のあり方を記述する記述言語学の一形態としての価値を有する.本発表では,このような問題意識のもと,文字の直線的な羅列のみを見ていても言語構造が見え難いような文字資料をも対象としつつ,文字資料が持つ情報の,何を,どのように,整理 ・ 構造化して,それらを情報処理に結びつけていくべきなのか,という点について言語学の立場から提案を行う.