著者
高橋 洋成 永井 正勝 和氣 愛仁
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015, no.5, pp.1-5, 2015-01-24

近年のコンピュータとインターネットの発展に伴い,これまでコンピュータ上では転写テキストとして扱われることの多かった言語資料を,音声,動画,画像と一緒に保存・利用することが容易になった.著者らは古代エジプト神官文字文書,楔形文字粘土板資料,近代日本語文典資料などの文字資料を統一的に扱うための画像データベースと,World Wide Web 上のプラットフォームを構築している.さらに,本プラットフォームは次の 2 点を目指している.(1) 本プラットフォームの内部に格納された言語資料および研究データを,外部に保存し共有するために Text Encoding Initiative (TEI) を利用すること.(2) データの保存と共有をさらに促進させるために,言語資料と研究データに関する RDF トリプルを生成し,Linked Open Data (LOD) として提供すること.本稿はこの 2 点について,現在までの取り組みと具体例を報告する.Recent development of the internet and computer technologies makes it easier to compile various linguistic materials such as audios, videos and photos with their transliteration texts together. The authors are constructing the general-purpose image database and the platform on World Wide Web for the linguistic studies on hieratic texts of Ancient Egypt, cuneiform tablets of Ancient Orient, and Modern Japanese Grammar Textbooks. The platform aims on the following two points: (1) to use Text Encoding Initiative (TEI) for preservation and sharing of the internal data with its outer world, (2) to create sharable RDF triples from the data to provide them as Linked Open Data (LOD). The current snapshot of the developing platform will be discussed.
著者
田中 良典 井出 明
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2011, no.10, pp.1-8, 2011-05-14

本研究は、大学生の観光ニーズを推定することを目的としている。実験として、大学生に対し、希望する旅行についての自由記述アンケートとライフスタイル調査を実施した上で、得られたデータを元に、テキストマイニング分析をおこなった。その結果、属性ごとで特徴的な語や対応分析から、女性は歴史好きな層を中心に世界遺産をゆっくり巡る旅行、男性は理系が一人旅、文系は個人ツアーを好むなど具体的な観光ニーズを推定することが出来た。The purpose of this research is to seek for needs of tourism among university students. We firstly conducted a free writing questionnaire and survey about the lifestyle of university students and then conducted text-mining analysis. From the analysis, we have discovered some interesting features that depended on personal attribution. For example, "Women, who love history, are fond of slow travels to see the world heritages," "Male science course students like to travel alone," and "Arts students choose personal tours" were some of the interesting inclinations obtained from the analysis.
著者
守岡知彦
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.3, pp.1-6, 2013-01-18

「CHISE IDS 漢字検索」 や 「東洋学文献類目データベース Ver.7」 の詳細画面表示に用いている "EST" に対して RDF/XML 形式での出力機能の追加を試みた。ここでは階層的素性名の RDF/XML における述語へのマッピングに焦点を当てて概説する。
著者
北﨑 勇帆
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-106, no.5, pp.1-6, 2015-05-09

洒落本は,近世期に刊行された小説の一形態であり,近世日本語の口語資料としての有用性が高い.この洒落本には,書名や話の粗筋を同一にしながら,江戸板・上方板で内容や語彙に異同のある作品が存在する.上方で刊行されたものが後に江戸で改作された 『月花余情』 組と,江戸で刊行されたものが後に上方で刊行された 『郭中奇譚』 組である.本稿ではそのような江戸・上方間で改作が行われた洒落本のテキストを TEI P5 に準拠してマークアップすることにより,当時の東西言語の比較資料として用いることができる対照コーパスを構築した.
著者
山田 太造 古瀬 蔵 安達 文夫
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.9, pp.1-8, 2012-10-05

人間文化研究機構は,人文科学研究資源を一元的かつ網羅的に活用できる環境を目的として nihuINT を構築した.本稿では,人文科学研究資源から利用者が求める検索結果を得るための探索支援の方法について述べる.In order to construct an environment where research resources of humanities can be leveraged centrally and comprehensived, National Institutes for the Humanities (NIHU) have developed an integrated retrieval system called nihuINT. In this paper we describe a method of an exploring support which enables a user to obtain from the resources.
著者
村上浩介
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-2, 2014-10-11

国立国会図書館では,平成 21(2009) 年度から平成 24(2012) 年度にかけて SP レコードのデジタル音源約 4.9 万点を収集し,現在,「歴史的音源 (れきおん)」 のサービス名称で提供している.このサービスについて,概要を紹介する.
著者
小林 雄一郎 阿部 真理子
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014-CH-101, no.2, pp.1-8, 2014-01-18

本研究の目的は,多変量アプローチを用いて,ライティング・タスクにおけるトピックと課題文の影響を調査することである。分析データは,International Corpus Network of Asian Learners of English (ICNALE) を用いる。そして,英語学習者のライティングがトピックと課題文の影響を強く受けていることを明らかにする。
著者
土山 玄 村上 征勝
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014-CH-101, no.1, pp.1-6, 2014-01-18

本研究では,古典文学作品として著名な 『源氏物語』 と 『宇津保物語』 を分析対象とし,文の長さの分布を計量的に分析することで,両作品の各巻が作品別に分類されるのか検討を加えた.このような分析を行う背景に,欧米では古くは 19 世紀から文の長さを分析項目として,書き手の識別や同定を目的とした研究が行われていたが,その一方で,日本語で記述された文献については未だ十分に研究されていないことによる.本研究における分析の結果,文の長さの分布は日本語の文献においても,書き手の相違に起因すると考えられる文体的相違が認められた.
著者
後藤 真
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.5, pp.1-6, 2013-01-18

博物館をはじめとする MALUI 施設に関する資料情報の共有化は、文化資源の長期的な保存と活用にとって、重要な課題となっている。その中で Linked Open Data は、近年大きく注目される手法となっている。そこで、本発表では、花園大学歴史博物館の資料情報を材料に、より簡易な資料情報のデジタル化と LinkedData 化の意義を考えなおし、博物館施設における資料情報の管理手法に関して議論の材料を提案したい。The document information sharing about the MALUI facilities including the museum becomes the important problem. Linked Open Data becomes in particular the technique to greatly attract attention. Therefore, in this report, digitization and LinkedData of the document information that is simpler to materials in document information of the Hanazono University historical Museum reconsider significance of making it it. And I want to suggest the materials of the argument about management technique of the document information in museum facilities.
著者
小木曽 智信 小椋 秀樹 田中 牧郎 近藤 明日子 伝 康晴
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.4, pp.1-8, 2010-01-30

現在開発を行っている「中古和文UniDic」を紹介する.これは平安時代の仮名文学作品を典型とする和文系の資料を対象とする形態素解析辞書であり,すでに公開中の「近代文語UniDic」同様,日本語の歴史的資料の形態素解析を可能にするものである.In this paper, we present "Chuko-Wabun UniDic", which is an electrical dictionary for morphological analysis of classical Japanese. The dictionary is especially designed for the analysis of literary texts in the Heian period, and is an effective means for examining historical texts, like "Kindai-Bungo UniDic" for modern Japanese.
著者
小池 隆
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2021-CH-126, no.3, pp.1-5, 2021-05-15

本論文では,石造物研究における深層学習の活用例として,(1)車載カメラで撮影した動画からの石造物の検出と分類,(2)画像認識による月待塔オープンデータのデータエンリッチメントについて報告する.
著者
高田 智和 盛 思超 山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012-CH-93, no.2, pp.1-7, 2012-01-20

いわゆる 「異体字」 の概念を漢字の派生関係と通用関係とに整理した上で,人間文化研究機構研究資源共有化統合検索システムでの運用を想定し,検索のための必要最低限の 「異体字」 群を収録した異体漢字対応テーブルの作成事例を報告する。
著者
美馬 秀樹 丹治 信 増田 勝也 太田 晋
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012-CH-95, no.4, pp.1-8, 2012-07-28

本研究の目的は,1921年に創刊された岩波書店『思想』90年分(約1000号,約8600論文,約16万ページ)を題材とし,電子化・構造化を行うことで,a)『思想』という知の集積,分析により20世紀日本の哲学・思想史を明らかにすること,b)分析結果の学部・大学院教育での活用の方法論構築を進めること,及びc)歴史的文献テキストの電子化,アーカイブ化に関する方法論を確立すること,である.本稿では,上記『思想』のデジタルアーカイブ化とテキストマイニングに関し,『思想』雑誌の電子化・構造化の手順とその問題点を報告し,特に,OCRによる文字認識精度の向上,自動化・システム化に向けたレイアウト解析ソフトウェアの開発について,現状の取り組みと予備的に行った実験評価について報告する.
著者
守岡 知彦
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2009-CH-84, no.3, pp.1-5, 2009-10-17

CH 79 で発表した MeCab を用いた古典中国語形態素解析器のその後の改良について述べる。ここでは、特に、品詞 (素性) 階層の設計の問題と異体字処理の問題に関して焦点を当てる。
著者
安井 眞奈美
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014-CH-103, no.11, pp.1-4, 2014-07-26

本発表では,国際日本文化研究センターの 「怪異・妖怪伝承データベース」 (http://www.nichibun.ac.jp/YoukaiDB/) に所収されている怪異に関する膨大なデータの中から身体に関するものを集め,各身体部位に分けて分析を試みる.それを踏まえ,妖怪・怪異に狙われやすい身体部位を紹介し,そこにどのような身体観が表現されているのかを明らかにしたい.また,天理大学の学生たちの創作によるオリジナルの妖怪から,現代の若者たちの身体観を探る試みについても紹介したい.
著者
亀田 尭宙 貴志 俊彦 原 正一郎
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2019-CH-119, no.12, pp.1-4, 2019-02-09

京都大学東南アジア地域研究研究所では,戦前戦中に発行された東アジアの絵葉書をデータベースとして整理 ・ 公開している.これまで国際連携のために,Linked Open Data や International Image Interoperability Framework に対応した公開を進めてきた.また,それぞれの弱点である,ドメイン研究者によるデータの簡便な登録と更新や応答の早い検索 API について,当研究所が構築してきた My データベースや Elasticsearch との連携によって補っている.本稿では,データの具体的な形式やシステム間の連携について詳述し,活用に至るまでの課題について議論する.
著者
永崎 研宣
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-113, no.6, pp.1-6, 2017-01-28

本稿は,人文系研究データの共有にあたって近年広まりつつあるオープンデータと IIIF という二つの潮流について,それぞれの意義 ・ 可能性 ・ 課題について,論点を整理しつつ今後を見通すことを目指すものである.オープンデータに関しては,デジタル画像資料の利用のしやすさや永続性という点ではメリットをもたらし得るが,異版の登場 ・ 乱立や一次配付元の活動の意義の説明に問題を生じる可能性があり,これを踏まえた評価方法を確立する必要がある.IIIF に関しては,一次配付元の存在感が高まる可能性がある一方で,責任も大きくなる.また,技術的課題もいくつか存在しており,解決に向けての国際的な協調も必要である.
著者
井出 明
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.5, pp.1-7, 2012-10-05

地域の公共図書館はこれまで、主として二つの役割を担ってきた。その一つは、情報が内包された "図書" という媒体を集め、地域住民に貸し出す拠点としての機能である。そしてもう一つが、地域情報の蓄積と提供の機能であろう。しかし近年、高度情報化社会の到来や指定管理者制度をはじめとした様々な制度改革の中で、公共図書館を取り巻く情勢が変化しつつある。その帰結として、図書館に求められる役割も変化し、図書館は新たなる方向性を見出す必要性に迫られているといえよう。本稿では、筆者が提唱する "情報まちづくり論" の観点から、今後の図書館のあるべき姿を考える。Until now, local public libraries played mainly two roles. One is to collect books that contain information and lend them to local people. The other role is to preserve local information and make it available to people who want to learn more about it. However, as a result of the arrival of the era of advanced information societies and designated administrator systems, the situation in public libraries has changed. Thus, the roles that people expect libraries to play have also changed, and now it is necessary for libraries to find a new direction. This paper discusses future roles of libraries with regard to information-based "Machizukuri (which refers to constructing cities, building communities, etc.)".
著者
宝珍 輝尚 野宮 浩揮
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014-CH-101, no.5, pp.1-7, 2014-01-18

伝統技能の継承を目的として,「間」 に着目して基本動作についての検討を行ってきている.これまでに,「間」 の種類についての考察を行い,また,茶道のお点前から 「間」 に着目して基本動作の導出を試みてきている.本論文では,まず,テンポを変化させて表情付けや感情込めをする演奏・動作を 「間」 ととらえ,その開始と終了についての考察を行う.ここでは,「早く開始」,「遅れて開始」,ならびに,「遅れて終了」 が使用されていることを示す.次に,動作における 「間」 に着目した基本動作の導出の妥当性を検証する.導出にあたっては,おおまかな動きをもとに典型的な基本動作の区間と類似した区間を求める方法を採っているが,適切な区間長,おおまかな動きの程度,ならびに,類似か否かを判断する閾値が必要である.本論文では,これまでに得られている値が妥当であることを示す.また,基本動作の導出を試みる.
著者
守岡 知彦
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-8, 2010-07-24

CHISE の文字オントロジーを Wiki 的な手法で編集するための WWW サービス "CHISE-Wiki" を試作した。ここでは構造化された情報を拡張可能性を損なわずに容易に編集するための工夫に焦点を当てて概説する。This paper explains "CHISE-Wiki" which is a Web-service to edit the CHISE character ontology based on Wiki-way. In this paper, we focus how edit structured data easily and not spoil extensibility.