著者
西岡 千文 亀田 尭宙 佐藤 翔
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.30, no.1, pp.3-20, 2020-02-29 (Released:2020-03-27)
参考文献数
55

学術出版物のオープンアクセスが進展し,自由にアクセス可能な学術情報が蓄積されている.一方,引用データに関しては,機械可読なアクセスのオープン化が遅れている.このような状況を解決するために,I4OC(Initiative for Open Citations)が設立され,オープン・サイテーション,すなわち引用データのオープン化を推進している.本稿では,I4OC の取り組みによって公開された引用データを分析することで,日本におけるオープン・サイテーションの現状の把握を試みる.結果,世界の学術出版物において引用データをオープンにしている文献の割合は24.22%であるのに対して,日本の学術出版物においては18.86%であることが判明した.オープン・サイテーションを推進するための今後の課題として,過去の文献と人文学系分野の文献の引用データの組織化の支援が挙げられる.
著者
亀田 尭宙
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.25, no.4, pp.325-332, 2015-12-12 (Released:2016-03-11)
参考文献数
12

本論文では, 地域情報学のこれまでの研究を, 地域情報学を構成する4つのパーツ(情報基盤, ツール, 知識ベース・オントロジ, 地域に関するデータ)と3つの軸(主題, 空間, 時間)の下に位置づけて俯瞰した.主に, 京都大学地域研究統合情報センターに関わる実践事例を中心にしつつ周辺の技術動向も含めて紹介することで, そこから課題とこれからの展望を描いた.
著者
荒川唯 亀田尭宙 相澤彰子 鈴木崇史
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.617-618, 2012-03-06

Twitterは,東日本大震災の際にも活用され,新たなメディアとして注目を浴びている.Twitterに関する研究は数々行われてきたが,ここでTwitter上での情報の発信,伝播について改めて問い直す必要があると考えられる.本研究の目的はTwitterのRetweet(以下RT)されやすいTweetを実証的に分析し,特徴を示すことである.データとしてフォロワー数の多い40アカウントの約28,756Tweetを収集した.文体と内容の特徴を抽出し,ユーザーのカテゴリーごと,RT数ごとに,機械学習による分類実験を適用した.本研究はRTされやすいTweetの特徴を示すことで,新しいメディアにおけるコミュニケーションの一面を考察し,人々のTwitterでの情報発信,伝播の一助となることを目指す.
著者
亀田 尭宙 貴志 俊彦 原 正一郎
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2019-CH-119, no.12, pp.1-4, 2019-02-09

京都大学東南アジア地域研究研究所では,戦前戦中に発行された東アジアの絵葉書をデータベースとして整理 ・ 公開している.これまで国際連携のために,Linked Open Data や International Image Interoperability Framework に対応した公開を進めてきた.また,それぞれの弱点である,ドメイン研究者によるデータの簡便な登録と更新や応答の早い検索 API について,当研究所が構築してきた My データベースや Elasticsearch との連携によって補っている.本稿では,データの具体的な形式やシステム間の連携について詳述し,活用に至るまでの課題について議論する.
著者
森近 憲行 濱崎 雅弘 亀田 尭宙 大向 一輝 武田 英明
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.2, pp.335-340, 2011 (Released:2011-01-06)
参考文献数
11

In this paper, we describe our approach for information extraction from documents, which is based on supervised machine learning and collective intelligence approach. This approach is aimed at redeeming each method, because each method has merits and demerits. It provides various ways for users to input data to improve information extraction. Users can add not only supervised data but also a rule to extract values for a set of attributes. Various ways to input data allows many users to add a lot of data for quality improvement and machine learning can reduce noise of data input by users. We implemented it in event-information extraction system, and the experimental result shows effectiveness in correctness and convenience.
著者
古川 忠延 亀田 尭宙
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.23, no.6, pp.841-843, 2008-11-01

今回の学生フォーラムでは,東京工業大学精密工学研究所の奥村学准教授にインタビューを行った.言語処理の分野で活躍する氏は,blogWatcherやPRESRIなど,研究成果を積極的にシステムとして公開している.そうした氏の研究室の運営理念や,今後のWeb研究に対するお考えなど,さまざまなお話を伺うことができた.
著者
西岡 千文 亀田 尭宙 佐藤 翔
出版者
情報処理学会
雑誌
情報処理学会研究報告: 人文科学とコンピュータ(CH) = IPSJ SIG Technical Report (ISSN:21888957)
巻号頁・発行日
vol.2019-CH-120, no.5, pp.1-8, 2019-05-04

近年, 学術出版物のオープンアクセスが進展し,自由にアクセス可能な学術情報が蓄積されている. 一方で,研究評価など様々な目的で利用されている学術出版物の引用データに関しては, 機械可読なアクセスのオープン化が遅れてきた. このような状況を解決するために, I4OC (Initiative for Open Citations) が学術機関と出版社によって設立された. 本稿では, I4OC が公開している引用データを, JaLC メタデータと unpaywall により公開されているデータとともに利用することで, 日本の学術出版物の引用データのオープン化の現状分析を試みる.
著者
亀田 尭宙 加藤 文彦 神保 宇嗣 大向 一輝 武田 英明
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

生物多様性や環境の問題において共有するべき生物情報は様々な分野に関わる。本研究では、生物情報を共有する Linked Open Data 基盤として構築を進めてきた LODAC Species へ、生物多様性に関する重要なデータである絶滅危惧種情報の統合を行った。和名や学名を手がかりとして効率的に情報を統合できた一方、統合に工夫が必要な種も見られた。これらの現状と課題について報告を行う。
著者
亀田 尭宙 大向 一輝 武田 英明
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

あるリソースにアクセスした際に,ハッシュ関数を用いたコンテンツの同定とOpenIDによるユーザの同定を日時やURLと共に記録することで,情報の提供者および取得者が内容についての証明を得られるようなメタデータベースを構築した.また,このメタデータ同士の関連を記述することでコンテンツの流通をネットワークとして把握し,それを分析することで,コンテンツの信頼性評価に用いることを提言する.