著者
江上 周作 渡邊 勝太郎
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.60, no.4, pp.261-270, 2017-07-01 (Released:2017-07-01)
参考文献数
6

現在,オープンデータの取り組みは世界的に広がりをみせており,実際の利用例の開拓を目的としたコンテストは注目を浴びている活動の一つである。日本国内で最初期から活動を継続しているコンテスト「Linked Open DataチャレンジJapan」は,Linked Dataに力点を置いているだけでなく,協賛者のデータを使った応募作品を作るハッカソン等イベントを共催で開催できる特典をスポンサーに用意するなど特色ある制度が存在する。本稿では,コンテストの運営者の視点に加えて,スポンサー・データ提供で協賛したデータ提供者の両方の視点から,コンテスト形式でのオープンデータ普及活動の実例を紹介する。LODチャレンジのこれまでの歩みと2016年の開催報告,JST(科学技術振興機構)との共催のイベント開催の様子とコンテストにデータを提供することのメリット,そして今後の展望と課題について述べる。
著者
川村 隆浩 渡邊 勝太郎 松邑 勝治 櫛田 達矢 古崎 晃司
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.59, no.12, pp.839-848, 2017-03-01 (Released:2017-03-01)
参考文献数
23

近年,大規模書誌情報データベースを対象とした科学計量学の研究が盛んに行われている。そのため,論文や特許,研究データの分類やクラスタリング,検索のため科学技術に関するシソーラスの重要性が増している。科学技術振興機構(JST)では,1975年からJST科学技術用語シソーラス,また2005年からは関連する大規模用語辞書の構築・改訂を進めてきたが,今回,合わせて約24.5万概念を含む両者を国際標準化団体W3Cが規定するResource Description Framework形式のLinked Dataに変換し,期間限定で公開した。本稿では,まずJSTシソーラスおよび大規模辞書の概要,およびLinked Data版の特徴や有用性について述べる。そして,さまざまなドメインオントロジーをつなぐハブとなるトップレベルオントロジーとしての位置付けについて考察し,オントロジー的観点から概念間の関係性の再整備を進めているライフサイエンスカテゴリーにおける取り組みを紹介する。最後に今後の取り組みとして自然言語処理技術による半自動的なシソーラス保守・整備作業の可能性について触れる。

3 0 0 0 OA J-GLOBAL knowledge

著者
木村 考宏 川村 隆浩 渡邊 勝太郎 松本 尚也 佐藤 智宣 櫛田 達矢 松邑 勝治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.N-F73_1-12, 2016-03-01 (Released:2016-03-31)
参考文献数
9
被引用文献数
1 1

In order to develop innovative solutions in science and technology, Japan Science and Technology Agency (JST) has built J-GLOBAL knowledge (JGk), which provides papers, patents, researchers' information, technological thesaurus, and scientific data as Linked Data, which have been accumulated by JST since 1957. The total size of all datasets is about 15.7 billion triples, and the JGk website provides a SPARQL endpoint to access part of the datasets. This paper describes several issues on schema design to construct a large-scale Linked Data, and construction methods, especially for linking to external datasets, such as DBpedia Japanese. Finally, we describe performance problems and the future works.

2 0 0 0 OA J-GLOBAL knowledge:

著者
渡邊 勝太郎 木村 考宏 川村 隆浩 松本 尚也 佐藤 智宣 櫛田 達矢 松邑 勝治
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第12回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.109-114, 2015 (Released:2015-12-04)
参考文献数
8

JSTでは、文献、特許、研究者等の情報資産を生かし、日本国内の研究開発の成果・現状をエビデンスベースで把握する、知識インフラ構想を進めている。この一環として、JST情報資産をRDF化したサービス「J-GLOBAL knowledge」を構築した。本発表では、J-GLOBAL knowledgeの概要とJSTで利活用の現状について紹介する。

2 0 0 0 OA Mapping Science

著者
川村 隆浩 渡邊 勝太郎 松本 尚也 江上 周作 治部 眞里
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第14回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.119-124, 2017 (Released:2017-11-01)
参考文献数
8

近年,科学技術の関係性や発展を把握するため,さまざまなサイエンスマップが作られている.しかし,ファンディング情報や最新の論文は,十分な引用情報を持たないため,従来の引用分析を用いてマップ化することが難しい.そこで,我々は研究内容の類似度に基づいてマップを作成するため,ニューラルネットワーク技術を用いてプロジェクト概要や論文抄録などのテキスト情報を多次元ベクトルに変換する手法を開発した.文書ベクトル化することによって内容の類似性を定量的に測定することを始め,クラスタリングなどの統計処理や機械学習にかけることが可能になる.本論では,実際に 2012~2016 年の米国 NSF における約 3 万のプロジェクト情報,および同期間の Scopus 収録 IEEE 論文誌・国際会議論文約 27 万編の抄録を文書ベクトル化し,マップとして表した結果を示す.また,マップ上において,いくつかの萌芽領域が形成されていく様子(時系列的な構造変化)が確認できたことを示す.
著者
渡邊 勝太郎 大倉 克美 鈴木 至 松邑 勝治
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第14回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.101-106, 2017 (Released:2017-11-01)
参考文献数
1

科学技術文献データベースは特許データベースと異なり、その収録範囲は分野別、用途別、データベースベンダーのポリシーなどによって時に大きく異なる。本稿では総合系のデータベースとして著名なエルゼビア社の Scopus、クラリベイト・アナリティクス社の Web of Science(WoS)と JST の文献情報データベース(JST文献)を比較し、示唆を与えることを目的とする。3 種類のデータベースの収録範囲を ISSN を用いて集計した結果、Scopus と WoS の収録範囲は多くの雑誌(15,000 誌超)で重複しており、JST 文献の収録範囲は他 2 者との重複はさほど多くはないものの、学協会発行の雑誌や大学紀要等の国内の文献の豊富な収録状況(独自の収録13,000 誌超)が明らかになった。さらに、JST が実施している、JST 文献と Scopus とを書誌マッチングした結果を用いて、大学等公的機関と企業の共著関係を検索し、国内学会での発表等 JST 文献以外では収録していない情報から、研究初期の段階にあるテーマ等を追うことができる可能性を示した。
著者
川村 隆浩 古崎 晃司 櫛田 達矢 渡邊 勝太郎 松邑 勝治
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.26, no.2, pp.102-109, 2016-05-14 (Released:2016-07-15)
参考文献数
18

近年,科学計量学等での活用を目的にさまざまな科学技術用語シソーラスの構築が進められている.しかし,人手での整備には多大なコストと時間を必要とするため,自動,半自動的な構築・改訂手法の研究が盛んに行われている.そこで本論では,人手で十分に整備された情報がない新興・先端学術分野においても適用できるよう,文献抄録に書かれた自然文を入力としたシソーラス拡充手法を提案する.具体的には,近年,進展が目覚ましい単語の分散表現を活用し,新語を既存シソーラス階層内に適切に位置づける手法を検討する.実験では,医療系論文56.7万編から500次元の単語ベクトルを構築した上で,主成分分析による次元削減とクラスタリングを行った上で,既存シソーラス用語と新語との空間的な位置関係から意味的な関係性を推定した.そして,専門の作業者3名による結果と比較し,3-Bestで再現率80%以上であることを確認した.今後は,作業者への新語追加位置推薦システムを構築することでシソーラス拡充手法の半自動化を図っていきたい.
著者
江上 周作 渡邊 勝太郎 川村 隆浩 Shusaku Egami Katsutaro Watanabe Takahiro Kawamura
雑誌
人工知能学会研究会資料
巻号頁・発行日
vol.47, no.13, pp.1-10, 2019-03-10

従来の科学技術マップ(サイエンスマップ,Map of Science)は論文間の引用関係に基づくものが多く,競争的資金によるプロジェクト等の引用が蓄積されない文書同士の関係や,論文とプロジェクトの関係を同一画面で可視化分析することは困難である.そこで,我々はこれまで論文やプロジェクトの内容類似度に基づく科学技術マップを開発してきた.開発したマップは論文やプロジェクトの時系列変化,統計情報,特徴語表示などの基本的な機能に加えて,ユーザの求める様々な視点からの分析に向けた動的レイアウト生成機能や,より高度な分析に向けたSPARQL検索結果の可視化連動機能などを提供する.本稿では,開発した科学技術マップの様々な機能や,これらの機能を実現するバックエンドとしてのナレッジグラフの構築,システムの構成,インタラクティブな操作の実現に向けたクラスタリング手法について述べ,分析結果の例について紹介する.