著者
青池 亨 里見 航 川島 隆徳
雑誌
じんもんこん2018論文集
巻号頁・発行日
vol.2018, pp.97-102, 2018-11-24

The National Diet Library is now developing techniques for automatically recognizing which areas of a printed page are illustrations and which are graphemes, as a means of improving the searchability of digitized material. The ability to distinguish between illustrations and graphemes is expected to im- prove the accuracy of OCR processing by allowing areas without graphemes to be ignored while ena- bling the application of contrast correction to areas with graphemes, thereby improving readability of the digital images. Moreover, the ability to extract areas with illustrations is expected to have practical applications for content-based retrieval of similar images. This paper focuses on the extraction of areas with illustrations and reports on the creation of a system that is consistently able to extract illustra- tions from digital images of documents as well as perform content-based retrieval of images.Services incorporating these proposed techniques will be released on a trial basis on the NDL Lab web- site. (https://lab.ndl.go.jp/).
著者
村井 源 川島 隆徳
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.22, no.3, pp.203-222, 2012-10-10 (Released:2012-11-30)
参考文献数
17

本論文の目的は,批評対象に対する計量分析によって批評の科学的分析への基礎固めを行うことである.まず総合的芸術である映画と演劇に関する批評を対象として選択し,批評対象に関連した名詞を抽出した.抽出した名詞を30 のカテゴリに分類し,χ二乗検定によって映画と演劇で重要視する要素の相違を分析した.映画では特定の人物に中心的な言及がなされるのに対し,演劇では分散的な言及の特徴がみられた.次に,カテゴリ間の関係性を明らかにするために,因子分析を用いてカテゴリの共起を分析した.結果として「監督」と「演技」における映画と演劇でのニュアンスの相違が抽出された.最後にカテゴリのパターンを抽出するためN-gram 法を適用した.N-gram 法によって批評の論理展開の中心的要素が,映画の場合は「物語」であり,演劇の場合は「演技」であることが明らかとなった.
著者
青池 亨 木下 貴文 里見 航 川島 隆徳
雑誌
じんもんこん2019論文集
巻号頁・発行日
vol.2019, pp.115-120, 2019-12-07

国立国会図書館電子情報部電子情報企画課次世代システム開発研究室(次世代室)では,機械学習技術を図書館サービスに取り入れ,応用することで,資料の検索可能性と提供可能性の拡張を実現するべく調査研究活動に取り組んできた[1].また,これらの研究成果を活用したサービスを一般に利用可能な形で提供する場として,2019 年3 月に「次世代デジタルライブラリー(https://lab.ndl.go.jp/dl/)[2][3]」を公開した.他方,国立国会図書館のデジタル化資料の利活用促進や学術コミュニティへの貢献の観点から,外部の研究者やエンジニアが研究・技術開発用途に利用可能なデータセットを公開することも大きな意義がある.本論文では,国立国会図書館デジタルコレクションのデジタル化資料を活用して作成・公開したデジタル化資料のレイアウトのデータセット(NDLDocL)について,その特色や先行する他機関のデータセットとの相違点を紹介する.また,実際の構築過程における検討事項や開発したアノテーションツールの紹介と,現時点で想定している活用方法のアイデアについて述べる.
著者
村井 源 川島 隆徳 工藤 彰
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.22, no.1, pp.23-43, 2012-03-26 (Released:2012-06-29)
参考文献数
16
被引用文献数
1

評判分析などが自然言語処理技術によって進められているが,対象は主にWeb上のテキストであり,人文学的な批評文はその主たる対象となっていない.本研究では人文的な批評文の具体的批評対象を計量化することで,批評行為のより深い意味分析に向けての基礎固めを行う.総合的芸術作品である映画と演劇の批評文を対象として,抽出対象を人名と作品名に絞り分析を行った.結果として頻度分析とネットワーク分析で批評における人物の重要性やグループの傾向,他分野との関わりの相違が明らかとなった.またスタッフのデータベースの利用により,語られる固有名詞の批評文中での意味と機能の傾向が抽出された.
著者
村井 源 川島 隆徳 工藤 彰
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.21, no.2, pp.279-284, 2010-05-28 (Released:2011-06-25)
被引用文献数
1

評判分析などが自然言語処理技術によって進められているが,対象は主にWeb上のテキストであり,人文学的な批評文はその主たる対象となっていない.本研究では人文的な批評文の具体的批評対象を計量化することで,批評行為のより深い意味分析に向けての基礎固めを行う.本研究では批評文中の人名と作品に絞り,総合的作品である映画と演劇の批評において,誰についてどの作品について中心的に語られる傾向があるのかを計量し,カテゴリー分類と共起分析を行った.結果として演劇批評は集中的であり,映画批評は分散的・個別的であること,また演劇批評は強い芸術的指向性を持つことが明らかになった.
著者
川島 隆徳 研谷 紀夫
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.20, no.2, pp.183-188, 2010-05-15 (Released:2010-07-10)

本研究では,国立国会図書館の著者名典拠情報を拡充し,有効利用するための典拠情報共同編集プラットフォームを開発した.このプラットフォームはJAPAN/MARC(A)を読み込み,ネットワークを通じて複数の識者が足りない情報を追加することが可能である.また,必要に応じてMARCで定義されていない情報も追加することや,MADS及びMODS形式やその他の構造化記述言語で出力することも可能である.これらより,ネットワークに対応したより高度な文化情報資源の利用のために典拠情報を活用していくことが可能となる.
著者
原田 隆史 川島 隆徳
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.2, no.2, pp.132-135, 2018-09-03 (Released:2018-05-18)
参考文献数
7

地方自治体の95.7%が例規集をWeb上で公開しているが,その多くは自治体のWebページ内で閲覧ができるのみであり,複数自治体の例規を横断検索することは困難である。また,4.3%の自治体の例規はオンラインで検索ができない。本研究ではWeb上で例規集を公開している1,712自治体のデータを自動収集するとともに,Webでは公開していない自治体にも協力を依頼して本文のデジタル化およびメタデータの作成を行い,1,739自治体(全1,788自治体中の97.3%)の例規集を横断で全文検索できるデジタルアーカイブシステムを開発した。本システムでは,現行の例規に対する横断検索を行うことができるほか,自治体種別,語句の出現場所,制定年などを指定した詳細検索も行うことができる。また,改定されたり廃止された例規についても保存して検索することができるアーカイブ機能も備えている。
著者
村井 源 川島 隆徳 工藤 彰
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.21, no.2, pp.279-284, 2011-05-28
参考文献数
5

評判分析などが自然言語処理技術によって進められているが,対象は主にWeb上のテキストであり,人文学的な批評文はその主たる対象となっていない.本研究では人文的な批評文の具体的批評対象を計量化することで,批評行為のより深い意味分析に向けての基礎固めを行う.本研究では批評文中の人名と作品に絞り,総合的作品である映画と演劇の批評において,誰についてどの作品について中心的に語られる傾向があるのかを計量し,カテゴリー分類と共起分析を行った.結果として演劇批評は集中的であり,映画批評は分散的・個別的であること,また演劇批評は強い芸術的指向性を持つことが明らかになった.
著者
森嶋 厚行 川島 隆徳 原田 隆史 宇陀 則彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 人文科学とコンピュータ研究会報告
巻号頁・発行日
vol.2015, no.13, pp.1-4, 2015-05-09

近年,クラウドソーシングは問題解決の新しいアプローチとして注目を集めている.本講演では,クラウドソーシングの応用事例として,クラウドソーシングプラットフォーム Crowd4U を用いた NDL データ利用プロジェクトについて説明する.Crowd4U は,非営利・公益・学術目的のクラウドソーシングプラットフォームであり,公益と学術のタスクが稼働している.Crowd4U は大学によって開発が行われており,プロジェクトの要望に応じて様々な機能追加が日々行われている.L-Crowd プロジェクトは,Crowd4U 上で NDL データを用いて行われているプロジェクトの一つであり,ISBN による書誌同定における誤り (書誌誤同定) の判定をマイクロタスクで行おうというものである.本講演では,本事例の紹介を通じて,クラウドソーシングを利用した公益・学術プロジェクトの可能性を議論したい.
著者
川島 隆徳 徃住彰文
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.61, pp.17-24, 2008-06-25

オントロジーの知識を持った専門家だけが構築できる伝統的なオントロジーに対して,専門的知識無しで構築できるオントロジーは,オントロジー構築の敷居を下げるばかりでなく、新しい機能や用途を持つ可能性がある.フォークソノミーの手法を応用したオントロジーとしてフォークオントロジーを定義し,その概念的な枠組みの特徴づけをおこなった.1) 多義性を許し,2) 大規模性を前提とするフォークオントロジーの,大人数による協調構築をサポートする GUI エディタとして, Folk Ontology Workspace (FOWS) を設計し実装した.A major obstacle for ontology construction is that it requires high levels of both domain expertise and ontology skills to maintain internal consistency. In this paper, we propose a conceptual framework for a folk ontology which people can construct with only the appropriate domain knowledge. In order to realize this collaborative ontology construction, we have developed the Folk Ontology Workspace (FOWS), which is an ontology editor for distributed environments implemented in Java.
著者
村井 源 川島 隆徳 工藤 彰
出版者
Japan Society of Information and Knowledge
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.22, no.1, pp.23-43, 2012-03-26
被引用文献数
1

評判分析などが自然言語処理技術によって進められているが,対象は主にWeb上のテキストであり,人文学的な批評文はその主たる対象となっていない.本研究では人文的な批評文の具体的批評対象を計量化することで,批評行為のより深い意味分析に向けての基礎固めを行う.総合的芸術作品である映画と演劇の批評文を対象として,抽出対象を人名と作品名に絞り分析を行った.結果として頻度分析とネットワーク分析で批評における人物の重要性やグループの傾向,他分野との関わりの相違が明らかとなった.またスタッフのデータベースの利用により,語られる固有名詞の批評文中での意味と機能の傾向が抽出された.