著者
北本 朝展 川崎 昭如 絹谷 弘子 玉川 勝徳 柴崎 亮介 喜連川 優
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.58, no.6, pp.413-421, 2015-09-01 (Released:2015-09-01)
参考文献数
6
被引用文献数
3

地球環境情報統融合プログラムDIASは,大規模かつ多様な地球観測データを中心に,社会経済データなどとも統融合することで,環境問題など社会課題の解決に有用な情報を国内外に提供することを目的とする。DIASは研究データの基盤システムを構築するだけでなく,基盤システム上のアプリケーション開発を主導するコミュニティを確立している点で,世界的にもまれなプロジェクトである。本稿ではまずDIASの概要を紹介し,DIASが基盤システム,アプリケーション開発,研究開発コミュニティという3つのシステムから構成されることを述べる。次にデータ共有の観点から,データアクセス,メタデータ,データポリシーに関するDIASの考え方をまとめる。そして,DIASが国際的な社会課題解決に貢献した例として,チュニジアを対象に行った気候変動予測に基づく洪水対策の立案に資するデータ統合解析を紹介する。最後にDIASの研究開発における今後の方向性について考える。
著者
北本 朝展 堀井 洋 堀井 美里 鈴木 親彦 山本 和明
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.273-280, 2017-12-02

本論文は古典籍「武鑑」を対象として,大規模データを構造化するための全く新しいワークフローを提案する.まず「武鑑」を時間的に連続して変化する「時系列史料」という新しい種類の史料と捉え,そこから生み出される多数のバージョンをソフトウェア工学の観点から解釈し,これを板本書誌学の概念と対応させる.次にバージョン間の差分を検出する方法としてテキストベースと画像ベースのアプローチを比較し,「武鑑」では特に画像ベース差分検出が有効であることを示す.さらに差分検出と差分翻刻を合わせたアプローチを「差読」と呼び,そのためのワークフローを「人機分業」として構築することが「武鑑」の構造化の鍵を握ることを論じる.その最初の成果を「武鑑全集」として2017年11月に公開した.
著者
北本 朝展 西村 陽子
出版者
国立情報学研究所
雑誌
基盤研究(B)
巻号頁・発行日
2016-04-01

1. デジタル史料批判の基盤構築:Digital Critique Platform (DCP)の構築を進めた。今年度は、シルクロード遺跡の基礎情報を入力するためのメタデータスキーマを設計し、それを入力するためのウェブインタフェースを構築した。次にDCPの全体的な設計および既存ツールとの連携については、最終年度での改良と完成に向けて課題を明確化した。2. デジタル史料批判の実践:シルクロード探検隊が過去に撮影した古写真の保存状況について、ベルリンやロンドンのミュージアムを訪問して現地調査し、これらの活用について担当者とのディスカッションを行うとともに、担当者が来日した際には東京でも打ち合わせを行った。さらに中国においてもシルクロード探検史料の整理を行い、現地に保存されている実物の史料も合わせ、シルクロード探検報告書の地図の内容を分析した。この成果は、シルクロード探検に関する複数の史料の参照関係を解明するための足掛かりとなるものである。3. デジタル史料批判の拡大:モバイルアプリ「メモリーグラフ」はバージョンアップを繰り返しながら機能を充実させ、主要な機能を完成させることができた。また学術的な利用に加えて市民科学としての利用についても、京都や長崎などで事例を積み重ねた。一方、非文字史料の史料批判については、日本古典籍を対象に研究を進め、IIIF Curation Viewerのキュレーション機能も活用した画像分析を進めた。最後に、京都大学東南アジア地域研究研究所と連携した「華北交通アーカイブ」については、数万枚に及ぶ古写真のキャプション入力をほぼ終了し、最終年度での公開に向けた作業が進行中である。
著者
北本 朝展
出版者
日本地球惑星科学連合
雑誌
日本地球惑星科学連合2018年大会
巻号頁・発行日
2018-03-14

IIIF Curation ViewerはIIIF(International Image Interoperability Framework)に準拠した画像ビューアである。IIIFはもともとミュージアムやライブラリにおける高解像度画像の公開に相互運用性をもたらすためのコミュニティ活動から始まった。そして現在までに4つの仕様が公開されており、仕様に準拠したオープンソースソフトウェアも次々に構築されることで、IIIFを活用した画像公開は世界中に広まりつつある。ただしIIIFコミュニティは文化資源に関わる人々が中心となっているため、科学分野における利用例は未だに多いとは言えない。衛星画像や医療画像など、高解像度画像が研究の重要な素材となる割には標準化が進んでいない分野が科学分野にも多いことを考えると、そうした分野へのIIIFの適用にはまだ開拓の余地が大きいと考えられる。そこで我々は、ひまわり8号・9号の高解像度気象衛星画像を例として[1]、科学分野におけるIIIFのニーズと課題の調査を進めている。我々はすでにTimeline APIとCursor APIという拡張仕様を提案し実装した[2]。これは文化資源における「書籍」という概念を衛星画像における「時系列」という概念に拡張するための仕様であり、Timeline APIは時系列のモデル化、Cursor APIは時系列のように要素数が長大な場合の部分アクセスという問題に対する解を提示するものである。さらに、もう一つの拡張仕様であるCuration APIは、様々なIIIFソースからテーマに沿って部分画像を収集する「キュレーション」を実現するための仕様である。これはいわば、部分画像を切り取る「ハサミ」と並べてまとめる「ノリ」の機能を合わせたものであり、文化資源に限らず科学分野においても、様々な文脈による画像の再利用を広げることができる。これらの拡張仕様の開発は、世界の中でも我々の研究グループが先進的に取り組んでいるため、既存のIIIF準拠ソフトウェアでは対応できないという問題がある。そこで我々はIIIFの拡張仕様に対応した画像ビューアであるIIIF Curation Viewer [3]の開発を進めている。これは人文学オープンデータ共同利用センター(CODH)が推進し、本間淳氏が中心開発者となってアクティブに開発を進めるオープンソースソフトウェアである。このビューアは上記の拡張仕様に関する機能をすべて備えており、拡張仕様の参照実装にもなっている。またCuration APIで作成したキュレーションを保存するJSONストアとなるJSONkeeper [4]も、CODHが推進しTarek Saier氏が中心となって開発が進むオープンソースソフトウェアであり、これらの連携によってIIIF活用のためのソフトウェア基盤も広がりつつある。では気象衛星画像に対してキュレーション機能はどのように活用できるだろうか?第一に研究ツールとしての活用がある。自分が興味のある現象を矩形で囲んで「お気に入り」にブックマークすれば、後から現象を一覧することができるのが利点である。例えばカルマン渦が出現した気象衛星画像だけを集めれば、カルマン渦がどのような状況でどのように出現しているかを一覧でき、個々の場面に詳しいメタデータを付与すれば検索できる機能も将来的には実現する計画である。これによって、キュレーション機能は研究素材集として活用できるようになると考えられる。第二に、気象図鑑としての活用である。著名な現象が発生した日時の気象衛星部分画像をキュレーションに加えていくことで、「名場面集」を中心とした一種の図鑑を構築することができる。これは教育目的には有用な資源となるであろう。さらにこれを静止画だけでなく動画にすることで、時間発展する現象のダイナミクスを把握しやすい「動く図鑑」にすることも可能である。具体的には、Curation API、Timeline API、Cursor APIという3つの拡張仕様とImage APIという標準仕様を駆使し、それらをつなぐ簡単なスクリプトを開発することで、開始フレームと終了フレームをキュレーションに登録すれば、その間を線形補間でつないで動画化するシステムが構築できる。さらにIIIF Curation Viewerの固定幅切り取り機能を活用すれば、この動画を指定の大きさで作成することも可能となる。このように画像アクセスを標準化し、ツールをオープンソースとして組み合わせ可能な形で構築することによって、より複雑な処理もツール群の組み合わせによって簡単に実現可能となることが期待できる。このように相互運用性とオープンなアクセスに基づく画像公開は、衛星画像のような科学分野においてもメリットが大きいと考えており、その一つとしてのIIIFの可能性については今後も研究を進めていく計画である。 参考文献:[1] デジタル台風:次世代気象衛星「ひまわり8号・9号」画像/動画, http://agora.ex.nii.ac.jp/digital-typhoon/himawari-3g/[2] IIIFを用いた高品質/高精細の画像公開と利用事例, http://codh.rois.ac.jp/iiif/[3] IIIF Curation Viewer, http://codh.rois.ac.jp/software/iiif-curation-viewer/[4] JSONkeeper, https://github.com/IllDepence/JSONkeeper
著者
北本 朝展
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.59, no.5, pp.293-304, 2016-08-01 (Released:2016-08-01)
参考文献数
8

「デジタル台風」とは,台風に関するあらゆる情報を整理し,誰でもアクセス可能なデータプラットフォームの構築を目標とするプロジェクトである。気象データや社会データなどさまざまな大規模データを統合するだけでなく,データの意味を類似性やランキングといった相対値の文脈で解釈する機能など,「デジタル台風」にしか存在しないユニークなデータや機能が人気を集めている。本稿はこのデータプラットフォームを2つの観点から考察する。第1に,公開から約13年間の約1億6,300万ページビューのアクセス解析に基づき,時間変動する情報価値や情報流通におけるソーシャルメディアの価値などを考察する。第2に,デジタル台風が直面するさまざまな持続可能性の問題を,パスファインダーによるキュレーションや,市民科学とオープンサイエンスのかかわりといった観点から論じるとともに,持続可能なデータプラットフォームに向けて目指すべき方向を展望する。
著者
北本 朝展 鈴木 親彦 寺尾 承子 堀井 美里 堀井 洋
雑誌
じんもんこん2020論文集
巻号頁・発行日
vol.2020, pp.171-178, 2020-12-05

本論文は,歴史地名の構造化と統合のための地名リソースの構築を進めるとともに,地理的史料と地名リソースの間でのエンティティリンキングの可能性を複数のケーススタディの結果に基づき検証する.またこうして構築した地名情報基盤の上で「歴史的行動記録」を構造化しつつ,江戸という都市または時代に関するビッグデータ分析を進めていく上での現状と研究課題について議論する.
著者
北本 朝展 市野 美夏
出版者
日本地球惑星科学連合
雑誌
日本地球惑星科学連合2019年大会
巻号頁・発行日
2019-03-14

1. はじめに過去の書籍や文書から情報を抽出し、それを統合することで、過去の世界を復元して分析する。このような歴史研究を我々は「歴史ビッグデータ」と呼ぶ。それはこのアプローチが、現代を対象に行われる「ビッグデータ」の研究と同じ構造や同じ目的を持つため、現代ビッグデータを過去に延長していくことに意味があると考えるからである。しかしそこに立ちはだかるのがデータ構造化である。過去のドキュメントにくずし字(手書き文字)で書かれたデータから、過去の世界を計算処理で復元するための高品質データを整備するには、デジタル化から品質管理に至る長大なデータ構造化ワークフローを支援する情報基盤が必要である。しかし自動的な構造化は困難なため、人間と機械の共同作業による効率的なデータ構造化ワークフローが必要である。そこで本研究は、非構造化データ(画像・テキスト)を構造化データ(解析準備データ)に変換するワークフローを設計し、再利用かつ検証可能な人文学データセットを構築するための情報基盤を構築する。EUでは「Time Machine Flagship」(https://timemachineproject.eu/)という巨大プロジェクトが200機関以上の参加を得て立ち上がりつつある。そして、イタリアのベニスやオランダのアムステルダムなど、都市の歴史のビッグデータを集めて時空間を自由に行き来する「タイムマシン」の構築が始まっている。この動向は日本やアジアにはまだ波及していないため、本研究で構築する情報基盤は日本の拠点となってグローバルな活動と連携できる可能性がある。2. 課題過去の世界を復元するための研究はこれまでも数多く行われてきたが、歴史ビッグデータ研究は以下の点で既存のアプローチとは異なる。第一に、対象とするデータの種類である。例えば古気候研究の場合、気候に関するあらゆるデータを用いるため、書籍や文書に限らず、自然界に残された痕跡(アイスコアや年輪などのプロキシデータ)なども活用することになる。しかし歴史ビッグデータの対象はあくまで人間が残した記録に限定し、文字記録の読み解きを含めた新しいデータ構造化の研究に焦点を合わせる。第二に、対象とする分野である。単一分野の研究では、過去の世界の一部の現象のみを対象とし、それ以外の現象には注意を払わないことが多かった。例えば同じ日記を研究対象としていても、書誌データや抽出データは研究者グループを越えて共有されず、多数の研究者が同じような作業を繰り返す状況に陥ることが多かった。この状況を解決するため、歴史ビッグデータは分野横断的に活用可能な構造化ワークフローを提供し、情報共有のメリットを活用した研究を可能とする。3. データの掛け合わせと読み替え現代ビッグデータを過去に延長するには、技術の過去への延長に加えて、コンセプトや方法論の延長も重要な課題である。第一に、データの掛け合わせとは、異なるデータを重ねて意外な関係性を見出すという方法論である。その典型的な例が地図である。複数のデータを位置合わせして重畳表示することで、データから得た洞察をアクションにつなげることができる。そこで課題となるのが、APIの相互運用性や語彙の共有などである。この問題を解決するために、我々は研究グループの今後の研究課題を共有し、作業の重複を避けてお互いの強みを活かすことで、限られたリソースを最大限に活用した情報基盤を開発している。第二に、データの読み替えとは、ある目的に作られたデータを別の目的に再利用することの価値を見出す方法論である。現代ビッグデータにおいて有名な例は、車の走行データを震災時の通れる道マップに再利用するという事例であるが、同様のアイデアは歴史ビッグデータでも有用なはずはずである。例えば、人名録の変遷は気候変動の社会影響評価に使えないかなど、柔軟に発想を巡らせてデータを創造的に活用する必要がある。4. 同床異夢を越えて歴史ビッグデータ研究は、多分野を融合した研究である。もちろん人文学と理工学など文理の間には大きな違いがあるが、理工学の中でも分野による考え方の違いは決して小さくはない。こうした違いをどのように乗り越えるか。我々の基本的な考え方は、まず同床異夢であること、すなわち共同研究のメンバーが目指す個々の夢は異なることを認めた上で、なお同床であることの意義を積極的に評価するというものである。例えばデータやツールは夢が異なるものの間でも共有できるはずである。こうした共有のメリットを最大化した上で、個々の研究者は過去世界の異なる部分の復元に挑むというのが歴史ビッグデータ研究の構想である。
著者
北本 朝展 筆保 弘徳
出版者
国立情報学研究所
雑誌
挑戦的萌芽研究
巻号頁・発行日
2016-04-01

台風は気象学的にも社会的にも重要な現象であるが、その勢力や構造に関する分析はこれまで専門家の人手による方法に頼ってきた。そこで本研究は、台風に関する大規模衛星画像データセットに機械学習(特に深層学習)を適用することで、ビッグデータという視点から台風を分析する新しい手法を提案する。取り組んだテーマは「台風階級の分類」「台風中心気圧の回帰」「台風から温帯低気圧の遷移」「時系列モデルへの拡張」の4つである。特に「台風から温帯低気圧への遷移」に関しては、深層学習ベースの新指標「温低遷移指数」を提案して気象庁ベストトラックと比較したところ、気象庁のタイミングが平均して半日ほど遅いとの結果を得た。
著者
北本 朝展 絹谷 弘子
出版者
日本地球惑星科学連合
雑誌
日本地球惑星科学連合2019年大会
巻号頁・発行日
2019-03-14

1. JDARNの設立と経緯Japan Data Repository Network (JDARN)とは、日本のデータリポジトリを対象として、世界の最新動向を共有しながら、信頼性を向上させるための取り組みを進める、コミュニティ活動である。その源流は、ジャパンリンクセンター(JaLC)が2014年10月から2015年9月にかけておこなった「研究データへのDOI登録実験プロジェクト」にある。このプロジェクトは、研究データに関する専門家が分野を越えて集まったという点では日本初とも言える画期的な場となった。この活動を引き継ぐものとして研究データ利活用協議会が2016年6月に設立され、その後いくつかの小委員会が提案されることとなった。その一つとして2017年10月に我々が立ち上げたのが「国内の分野リポジトリ関係者のネットワーク構築」小委員会である。2018年10月からは、より多くの分野と関係者を対象とするために「ジャパン・データリポジトリ・ネットワーク(Japan DAta Repository Network : JDARN)」と名称を変更した。JDARNはデータリポジトリに関する動向を共有することが目的の一つであるが、中でも焦点となっているのがデータリポジトリの信頼性という問題である。研究データの生産者がデータを外部サービスに預ける際に、どこに預けるべきかを意思決定する基準として、データリポジトリの信頼性は重要な役割を果たす。そうした信頼性を示す基準の一つにCoreTrustSeal (CTS)がある。CTSはデータリポジトリに関する国際的な認証の一つであり、2019年2月現在で140あまりのデータリポジトリが認証を受けているが、日本ではまだ認証を受けているケースが少ない。CTSの認証が日本では少ない理由を探るため、2017年12月にセミナー「信頼できるデータリポジトリ〜CoreTrustSeal認証に関する実践的情報共有の場〜」を主催し、日本の有力なデータリポジトリがCTSの要求要件を用いて自己評価(self-assessment)してみる試みを行った。その結果、CTSの背景となる考え方がわからないとCTSによる自己評価も難しいことが判明した。そこでまずCTSを理解するための資料の作成を開始し、これが小委員会の主要な活動となった。そしてさらに議論を重ねた結果、CTSありきでなく利活用の側面も考慮したデータリポジトリのガイドラインを作成する課題に活動がシフトしていった。2. データリポジトリのガイドライン現在作成中のデータリポジトリガイドラインは、基本的にCTSの要求要件(16項目)を参考にしつつ、CTSを直訳するのではなくJDARNが独自に構成を提案するものである。このようにCTSを再考するきっかけとなったのが、バイオサイエンスデータベースセンター(NBDC)の八塚茂氏によるCTSのアイテム単位の整理である。CTSの審査過程では、様々なドキュメントを用意しそれを公開していることが透明性の一つの証拠となる。そこでCTSを実際に獲得したデータリポジトリの申請書を分析し、そこで言及されているドキュメントの種類を整理することで、CTSに必要なドキュメントを準備するという次のアクションがわかりやすくなると考えた。CTSの抽象的な項目を具体的なヒト・モノなどに落とし込むことで、より理解しやすいガイドラインを作れる可能性が生まれたのである。しかしドキュメントの整理に比べると、データリポジトリに関わる人に関する項目の整理はより困難である。データリポジトリではどんな職務が必要なのか、それを担うのは誰なのか。しかも職務については、その職務を専門家として何と呼ぶかという名称の問題もある。データ専門家として近年提唱される職名には、データライブラリアン、データキュレーター、データサイエンティスト、データエンジニアなどがあり、その意味も人によって異なる。これらの職務の概念を整理し、それらの長期的なキャリアパスを示すこと、それができければデータリポジトリを基盤としたオープンサイエンスの展開はおぼつかない。こうした問題についてはまだ確固たるモデルがあるとは言えず、我々は現在も議論を続けている。3. 今後の展開JDARNは設立以来、毎月1回ほどの会合を開きながら活発な議論を交わしてきた。そうした議論に参加するデータリポジトリの数が増えれば、日本のデータリポジトリの品質を高め、世界の中での存在感も高め、オープンサイエンスのための基盤としての価値も向上するであろう。そのためにはデータリポジトリが研究に不可欠な存在となる必要がある。データリポジトリというデータのコンテナとしての信頼性・持続性の向上がCTSの焦点であるが、それに加えてデータの統合、分析、可視化、社会実装などコンテンツの利活用に向けた多様な専門家も必要になる。これを単独で担える組織は限られるため、データリポジトリ間のコラボレーションも重要な課題であり、そこにデータリポジトリのネットワークが活きてくると考えている。
著者
北本 朝展 小野 欽司
出版者
国立情報学研究所
雑誌
NII journal (ISSN:13459996)
巻号頁・発行日
vol.1, pp.7-22, 2000-12-20
被引用文献数
2

本論文の目的は、気象学的知識と情報学的アプローチとを融合した台風雲パターンの時系列解析法を提案し、台風解析における熟練者の解析作業支援や、大量の台風画像からの知識発見などを実現することにある。そのための基礎となるデータセットとして、本論文では20,000 枚規模の台風画像コレクションを構築する。ここで台風画像とは、台風のベストトラックに記録された台風中心が地図投影画像中心に一致するように、台風周辺領域を衛星受信画像から切り出したものである。このようなラグランジュ的表現によって、台風雲システム全体の動きから台風雲パターンに固有の動きを分離できる。次に本論文では、台風雲パターンに特徴的な楕円形状を表現するための手法として、変形楕円を用いた形状分解手法を提案する。この結果を用いて台風の日変化の解析という台風解析の問題に取り組んだところ、本論文で提案する手法は、気象学的知見と一致するような、気象学的に意味のある情報を抽出することができた。