著者
安田つくし 三原鉄也 永森光晴 杉本重雄
雑誌
第76回全国大会講演論文集
巻号頁・発行日
vol.2014, no.1, pp.541-542, 2014-03-11

個人が制作する同人誌市場がマンガのファンや制作者のコミュニティとして機能し、日本のマンガ文化の隆盛を支える要素となっている。多くの同人誌がコミックマーケットに代表される同人誌即売会や同人誌取扱書店を通じて流通している。しかし内容が多岐にわたる同人誌探索の手がかりとして用いられる制作者や制作物の主題に関する情報は統制が充分でなく、効率的な探索は困難である。特に、即売会の保有する出展者情報と取扱書店が保有する書誌情報との連携は行われておらず、また即売会が提供するジャンルは統制されていないまま利用されている。 本稿ではLinked Open Data技術を適用したデータモデルを制定し、作者やジャンルの関連性を表現する。それらの情報を利用し、同人誌の内容にアクセス可能となるような検索システムを提案する。
著者
小平 優衣 鈴木 啓史 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.8, pp.1-8, 2014-01-18

現在ディジタル環境でマンガを探すには,web 上の情報を参照するのが一般的である.タイトルや著者名などの書誌情報が利用される場合が多いが,マンガの内容や主題,キャラクタ等に関する情報も検索に利用されている.内容に即した検索を行うためには,マンガに関する情報を,マンガの何について説明している情報かを記述したデータとして利用できるようにする必要がある.また,これらの情報は一般的な語彙としてまとめられていないため利用することは難しく,情報共有を促進するためにはマンガの概念をディジタル上で機械が扱いやすくできるように形式化する必要がある.異なるマンガリソース間同士の参照や再利用,効率の良いリソースの生成を可能にするため,共通基盤となるマンガに関する情報を体系化し扱うことを可能にするオントロジーの構築を行った.構築のために Wikipedia のマンガに関するカテゴリ名を語彙として利用し,語彙同士の関係性を定義してオントロジーを構築し,マンガリソース同士を結びつけることで LOD として利用することを可能にした.構築したオントロジーは語彙の追加などの拡張が可能であり,マンガのあらゆる情報に繋げることが可能である.It is common for us to use information resources on the Web to find Manga in various genres. Bibliographic information such as author name and title are commonly used to find the resources. Other information such as subjects of the stories and leading characters and their genres, is obviously useful but not well organized in the current Web environment as commonly accepted vocabularies to present the contents of Manga. It is difficult to find a Web resource which provides a common vocabulary about Manga. In order to facilitate information sharing and to organize the information resources of Manga, we need a set of terms formally organized to represent fundamental concepts and instances of and about Manga. In this paper, we propose an ontology designed as a formal basis to organize information resources about Manga and to present instances representing concepts and entities included in or associated with a Manga. We build the ontology, which is named Manga Ontology, using the categories included in Wikipedia on the basic framework designed based on the Cinema Ontology[10]. Every instance included in the Manga Ontology is modelled based on the Resource Description Framework (RDF) in order to make the Manga metadata resources built on the ontology as a Linked Open Data (LOD) resource.
著者
久保 順子 辻 慶太 杉本 重雄
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.20, no.1, pp.15-31, 2010-02-26 (Released:2010-04-04)
参考文献数
28
被引用文献数
1

コンピュータを使用した専門用語自動抽出は,従来,対象とする専門分野のテキストコーパスのみをデータとして行っているものが多かった.しかし,専門用語の特徴として,対象分野のコーパスに頻出し,対象分野以外の他分野コーパスにはあまり多く出現しない点が挙げられる.そこで本研究では,対象分野コーパスと他分野コーパスとの用語の出現率の差を考慮した手法を提案する.実験では,女性学のテキストを対象分野のコーパスとして使用し,他分野のコーパスとして39分野のテキストを使用した.実験の結果,従来の代表的手法よりもかなり高い精度で用語が抽出できることが明らかとなった.また39分野のテキストから任意のテキストを選び他分野コーパスとして用いてコーパスの規模を縮小できるか実験を行った.その結果,対象分野と類似した分野のテキストを用いることで,39分野すべてのテキストを用いた場合の抽出精度・再現率に近づけることができた.
著者
何 雯凌 三原 鉄也 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014, no.9, pp.1-8, 2014-01-18

書誌レコードの機能要件 (FRBR) の第 1 グループで定義される実体の概念を利用することで、マンガの探索がより容易になると考えられる。その一方で、マンガにおいては、FRBR の第 1 グループの概念が作品全体や、編などで表される作品を構成するストーリー、あるいはストーリーを構成するより小さな単位 (各話のエピソードや複数のページやコマで表現されるシーン) など様々に考えられる。本研究は、マンガの作品全体を単位とするとらえ方に加えて、ストーリー単位をとらえることで、探索を効率化することを目指し、書誌データからのストーリー単位の識別を目指す。しかし、マンガの書誌データの中にストーリー単位に関する情報は少ないため、機械的に抽出することは難しい。本研究では、Wikipedia の本文データを利用し、マンガ書誌データからストーリー単位を抽出する手法を提案した。京都国際マンガミュージアムに所蔵しているマンガの書誌データを用いた実験を行い、本手法の有効性を示した。この実験の結果から、本手法は利用した Wikipedia の情報の質に大きく影響されるとことが分かった。Manga - a Japanese term meaning graphic novels and comics - has been globally accepted. In Japan, there are a huge number of monographs and/or magazines for manga. Functional Requirements of Bibliographic Records (FRBR) provides useful concepts for readers to identify entities of manga, e.g., works of manga, expressions of manga, and so on. However, it is not clear which unit of manga those FRBR entities represent. They can be a whole manga or a story as a part of a manga, or even some smaller units of a manga (i.e. a single scene or an episode). This paper examines how to identify a manga work using a set of bibliographic records maintained by the Kyoto International Manga Museum. This study is aimed to identify a Work instance of manga, which may be a work as a series of stories or as a single story, in order to help readers find a comic book as an instance of a work. It is known that authority data is useful to identify works from bibliographic records. However, there is not enough information to identify a manga story in the bibliographic data. In this study, we used Wikipedia as a dictionary of manga to identify a manga story in the bibliographic records. The result of our experiment shows that using Wikipedia data is possible, but it also shows that the accuracy and efficiency depend on the quality of the Wikipedia data.
著者
杉本 重雄
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.1, no.Pre, pp.67-70, 2017-09-08 (Released:2017-09-08)
参考文献数
3

現在の情報環境において利用者、特に一般利用者のためのアーカイブとそのコンテンツの利活用性を高めるには、アーカイブ横断的な検索機能に加え、Web上のいろいろな資源を視野に入れたコンテンツの複合的な組織化によるアクセス性向上が必要である。本稿では、マンガ等のポップカルチャを含む文化的コンテンツのアーカイブと東日本大震災アーカイブに関し、筆者の研究室で進めてきた研究から得た知見を基礎にして、アーカイブとそのコンテンツへのアクセス性向上を目的としてメタデータのモデルについて述べる。以下、はじめにメタデータの視点からアーカイブとそのコンテンツのモデル化に関する基礎的な概念について述べ、その後、筆者の研究とそこから得た知見を示す。
著者
両角 彩子 永森 光晴 杉本 重雄
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2008, no.105, pp.1-14, 2008-10-30

近年の情報技術の発展に伴い、マンガ作品の情報の共有・交換が盛んに行われるようになった。筆者らの研究室では、マンガに関する情報を統合的に扱うためのマンガメタデータスキーマを開発している。その一部に、読者が作品の内容を書き表すためのメタデータスキーマがある。本稿はマンガの知的内容を表すことを目的としているため、同心ストーリーの表現手法である小説や映画も参考にする。そこで、 Wikipedia 内に表れるマンガ麹小説の作品記事から 100 件をそれぞれ無作為に抽出し、記述項目について調査した。これらの調査結果および目次テンプレートを参考に、読者が作品の知的内容を書き表すためのメタデータ基本セットを提案する。Mangas, which are popular and important resource in our modern culture, are published not only in traditional printed media but also for PCs and mobile devices over networks. Metadata has crucial roles to enhance functionality to access to mangas in the networked information environment in various aspects. The goal of this paper is to discuss metadata elements required for describing intellectual content of mangas as graphic novels. In this paper, we analyzed mangas and novels in order to define the metadata elements to describe their intellectual confcetns as a story work. Then we defined several metadata elements and their refinements to express the common properties of the intellectual content. In this paper we propose a set of descriptive metadata elements for intellectual content of mangas based on the analysis and description templates of Wikipedia.
著者
白才恩 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.109, pp.15-22, 2007-11-08

大量のディジタルリソースが蓄積,発信されている現在,持続的に増加するディジタルリソースを将来に向けて保存,管理することの重要性が広く認められている。一方,ディジタルリソースが将来的に利用可能であり続けさせることの難しさも広く認められている。そこで,本稿ではディジタルリソースを長期保存するため,ディジタルリソースを保存するためのガイドラインを作ることを目的として,保存のためのメタデータに関する検討,ディジタルリソースのタイプによる特徴を検討する。ここでは,完全な保存は困難であるとの前提に立ち,ガイドライン作成の基礎となる,リソースの「エッセンス」をのこすための基準を検討する。Preservation of digital resources has been widely recognized as an important but difficult issue in the networked information society. Many studies have been done on this issue, and basic issues such as emulation and migration have been raised for digital preservation. This paper is aimed at discussing issues to develop guidelines for digital preservation. It first describes metadata schemas for digital archives, and then describes the characteristics of digital resources. This paper discusses several factors to identify issues to build the guidelines for digital preservation.
著者
西出 頼継 本間 維 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013, no.4, pp.1-8, 2013-09-19

近年,誰もが利用・アクセスを行え,再利用や再配布が許可されたデータセットである Open Data が増えてきている.しかし,Open Data の構造は複雑なものが多く,スキーマ定義がないと再利用が難しい.また日本において LOD として公開されている Open Data の数は世界全体と比べると少ない.本稿では,日本で公開されている Open Data を LOD として活用することを目的に,CKAN 日本語などで公開される日本のデータセットを対象にスキーマの分析やリンク関係などの調査を行った.その結果日本の Open Data ではスキーマ定義やデータセット間のリンクが少ないということが分かった.そして,Open Data を LOD として活用するためにはスキーマ定義を行うためのメタデータ語彙の推薦や,リンクで結ぶためのリソースの同定が必要であると考察した.In recent years, there has been an increase in the use of Open Data. These datasets are freely available to everyone to reuse and republish. Unfortunately, many Open Data structures are complicated and are difficult to reuse without a schema definition. Compared with the rest of the world, Japan releases relatively little Open Data as LOD. We investigated Japanese Open Data, focusing on CKAN-Nihongo schemas and links to improve the use of datasets as LOD. We found that there are few Japanese Open Data schemas and links. Therefore, we recommend that metadata vocabularies and identification of links to connect resources should make use of Open Data released as LOD.
著者
本間 維 永森 光晴 杉本 重雄
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2011, no.8, pp.1-8, 2011-11-15

Web 上で公開されている Web ページ中にメタデータを記述するために,RDFa や Microformats,Microdata など複数の標準的な記述フォーマットが提案されている.しかし,標準的な記述フォーマットに従ったメタデータを持つ Web ページの数はまだ少なく,メタデータを利用した情報流通支援を行うには,より積極的なメタデータ付与が求められる.本稿では,DCMI Description Set Profile を基にした情報抽出テンプレートによる,相互利用性向上や作成コスト軽減を意識したメタデータ生成手法を提案する.Standard metadata formats, such as RDFa, Microformats, and Microdata, have been recommended to embed metadata in HTML or XHTML documents. However, many web pages have no metadata written in those formats. The other side, non-standard formats describing information for layout of web pages is used widely. For increasing metadata more proactively, we regard information in non-standard formats as metadata, and integrate with metadata in standard formats. This paper proposes a method to create metadata from resources with embedded metadata in standard and non-standard formats.
著者
永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.118, pp.11-19, 2006-11-06
被引用文献数
1

ディジタル図書館やセマンティックウェブ技術の普及に伴って、多種多様な情報資源のメタデータが作成され利用されるようになってきた。公共図書館や地方自治体の中には、それぞれが作成したメタデータの組織化を行うために、独自の語彙を定義しているとこをも珍しくない。メタデータに付与する語彙を作成する場合、小規模であればその作成とメンテナンスは容易であるが、大規模な語彙を作成することは、コストやメンテナンスの観点から現実的ではない。そこで本研究では、国立国会図書館が2006年9月より提供を開始した国立国会図書館件名標目表(NDLSH)テキストデータをSKOS形式に変換し、ソフトウェアやネットワークを介して利用可能にした。また本研究では、SKOS版NDLSHテキストデータを対象とした、SKOSのためのグラフィカルなブラウザHANAVI(Hybrid And Network-Assisted Vocabulary Interface)の作成を行った。NDLSH (National Diet Library Subject Headings) is a list of subject headings applied to the catalog of the NSL. This paper describes how to represent NDLSH in SKOS (Simple Knowledge Organazation System) which is a formal language for representing controlled structured vocabularies such as thesauri or classification scheme. This paper also describes HANAVI (Hybrid And Network-Assisted Vocabulary Interface) browser which visualizes NDLSH.
著者
柊 和佑 阪口 哲男 杉本 重雄
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.58, no.8, pp.389-393, 2008-08-01 (Released:2017-04-28)
参考文献数
22

現在,膨大な数のWebページが日々作成され,更新されている。一方,それに伴って消えるWeb情報資源の存在が問題となっている。そのため,様々な国の図書館が中心となり,Web情報資源を収集し保存するWebアーカイブの構築と運用に取り組んでいる。2003年より,Webアーカイブに取り組む組織が協調してInternational Internet Preservation Consortium (IIPC)を作り,共通の規格とツールの研究開発を行っている。本稿では,先進各国のWebアーカイブの現状について,IIPCを中心とした視点から解説する。
著者
杉本 重雄
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.4, no.3, pp.275-279, 2020-07-01 (Released:2020-08-24)
参考文献数
3

オリンピックやパラリンピックなど、スポーツは我々が日常的によく接する話題であり、研究、教育などいろいろな観点からスポーツ分野のデジタルアーカイブへの期待は大きい。既存のデジタルアーカイブと同様に、スポーツ分野でも有形物と無形物の両面からのアーカイブ化が求められ、広い視野を持った取り組みが求められる。また、先端的情報技術の導入の進展に伴う、データのアーカイブといった機能も求められることになる。本稿では、スポーツ庁のスポーツ・デジタルアーカイブ構想調査研究事業の中での議論に関する筆者の理解を基礎として、将来に向けてスポーツ・デジタルアーカイブの開発、運営、利用を進めていくうえでの課題について述べる。
著者
大石 康介 豊田 将平 吉岡 孝祐 三原 鉄也 永森 光晴 杉本 重雄
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.2, no.2, pp.150-151, 2018-09-03 (Released:2018-05-18)
参考文献数
5

近年、マンガ・アニメ・ゲーム作品のアーカイブにおけるデータベース整備の取り組みが始まっている。本研究では、これらの横断的なデータベースに求められる、複数の作品が物語や登場人物を共有することで持つ関係を記述するデータセットの開発を行った。Wikipediaの記事及び構造情報を用いたデータセット作成手法を開発することで、それぞれ約12000件、5000件、30000件のマンガ、アニメ、ゲーム作品を対象にしたデータを作成した。
著者
志賀 大輝 三原 鉄也 永森 光晴 杉本 重雄 Daiki Shiga Tetsuya Mihara Mitsuharu Nagamori Shigeo Sugimoto
雑誌
人工知能学会研究会資料
巻号頁・発行日
vol.47, no.17, pp.1-9, 2019-03-10

マンガを主題に基づいて検索するためには、その主題に関する情報が提供されている必要がある。そのために、電子書籍ストア等ではマンガに主題語を付与しているが、その多くはシンプルなテキストによるキーワードであり、それが表す意味に基づいた検索を行えない。この問題は主題語の語彙を構築することで解決することができるが、膨大な数のマンガの主題の差異を表現できる大規模な語彙の拡充や整備にかかるコストは大きい。本研究では、マンガの主題検索のための主題語彙の構築を目的とし、その拡充と整備を支援する。そのために、拡充が必要な箇所の発見のための主題語彙とマンガの結びつけと、Web上の情報資源を利用した、拡充する語の候補の取得を行った。
著者
杉本 重雄 三原 鉄也 永森 光晴
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.2, no.4, pp.359-363, 2018-10-01 (Released:2018-11-20)
参考文献数
11

東日本大震災に関する記録を集めたデジタルアーカイブが多く作られ、国立国会図書館はそれらのポータルとして東日本大震災アーカイブひなぎくを提供している。現在、こうしたデジタルアーカイブの利活用性の向上が求められている。本稿では、筆者等がこれまでの研究から得た知見に基づきメタデータの視点から東日本大震災アーカイブにおける利活用性の課題に触れ、さらに、オープンデータ環境を利用したアーカイブ内ならびにアーカイブ間でのコンテンツ集約による利活用性の向上について述べる。最後に、アーカイブのコンテンツを結ぶことによる利活用性向上について考察する。