著者
森嶋 厚行 北川 博之
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.197-198, 1997-03-12

近年, ネットワークの普及に従って異種分散情報資源が容易に利用可能となり, それらの統合利用が重要な課題となっている. 我々は, 構造化文書とリレーショナルデータベースを対象とした, 統合利用環境の研究開発を行なっている. この統合利用環境(図1)では, まず, ラッパーが各情報資源中のデータを統合データモデルであるNR/SD モデルに変換し, メディエータが NR/SD モデルに基づいた統合操作の機構を提供する. [figure] NR/SD モデルは, 入れ子型リレーショナルモデルに, 構造化文書を扱うための抽象データ型 "構造化文書型" (SD 型) を導入したものである. NR/SD モデルの最大の特徴は, 構造化文書と入れ子型リレーション構造を, 動的かつ部分的に相互変換するためのオペレータ "コンバータ" (converter) にある. NR/SD モデルを利用することにより, 次のような応用が可能になる. (1)入れ子型リレーショナル代数系を利用して, 構造化文書群の操作を行なう. (2)入れ子型リレーション構造を構造化文書に変換することにより, 型と独立した検索やメタデータを手がかりとした検索を行なう. さらに, 部分的に変換を行なうことにより, 構造の異なるデータを適当な抽象度で抽象化し統一的に操作することができるので,構造化文書とデータベースという表現の異種性に加え, データ構造の異種性にも対処可能である. これは, 構造化文書のような準構造化データの操作に特に有効であると考えられる. これらの他にも, WWW のような環境において, データベース検索の結果を構造化文書の形式で求めたり, 構造化文書に対するビューを定義する, といったことも可能である. しかし, 従来の NR/SD モデルは以下のような点で制限があった. (1) SD 型で許される文書構造の制約が厳しく, SGML 文書等に現れる例外構造や再帰構造等に直接対応していない. (2) SGML 文書等に現れる, 要素に付随する属性の操作を考慮していない. (3)コンバータによる変換の対象となる, 入れ子型リレーション構造と構造化文書の構造の関係に制約があり, 任意の変換を行なうためには, コンバータ以外の演算も含めた複数の演算を,データ構造に従って複雑に組み合わせ適用する必要がある. 本稿では, NR/SD モデルを改良しこれらの問題点を解決したモデルとその応用例を示す. 特に, 入れ子型リレーション構造と構造化文書を相互変換するコンバータの改良を中心に説明する.
著者
中溝 昌佳 森嶋 厚行 杉本 重雄 北川 博之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.72, pp.397-402, 2004-07-14
被引用文献数
5

WWWは社会的に重要なメディアの一つとなったが,その特徴である動的な更新,分散管理などの理由により,WWWコンテンツの一貫性維持は一般に困難である.我々は,WWWのリンク切れやリンク先の内容の変化への対応という,リンクの一貫性維持を支援するシステムの研究開発を行ってきた.我々のシステムのポイントは,信頼度が高いリンクである「リンクオーソリティ」の概念を導入したことである.しかし,これまでに提案したシステムにおいては,リンクオーソリティの利用は,(1)利用者がシステムに明示的にリンクオーソリティを与えた場合,もしくは(2)システムがたまたまリンクオーソリティを発見した場合,に限定されていた.リンクオーソリティはリンク一貫性維持のための有力な手がかりであるため,これを積極的に利用するためにリンクオーソリティの発見を支援する仕組みが必要と考えられる.本稿では,リンクオーソリティを利用者に提供するリンクオーソリティサーバと,リンクオーソリティを発見するためのアルゴリズムを提案する.WWW has become one of the important media in our society, but it is difficult to maintain the integrity of its contents in general. We have been developing a system to maintain the integrity of links, which can cope with dead links and changes of the page contents of link destinations. The point of our system is that we introduced the concept of link authority, which means a well-maintained link we can depend on. In the previous works on our system, however, link authorities are used only when (1) they are explicitly specified by users, or (2) the system happens to find them. Since link authorities are effective in maintaining the integrity management of links, a mechanism to automatically find link authorities would be beneficial. This paper proposes a link authority server, which provides users with information on link authorities, and explains an algorithm to find link authorities.
著者
杉本 重雄 永森 光晴 森嶋 厚行 柴山 明寛 三原 鉄也
出版者
筑波大学
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

昨年度の研究から、ポップカルチャや途上国の文化財等の文化的コンテンツの利活用性向上には、よく組織化されたアーカイブデータとWeb上の多様なコミュニティ発信情報を横断的・統合的に扱う必要があるとの知見を得た。そのため、アーカイブ横断的・統合的なメタデータ集約技術研究における重要な対象であると判断し、東日本大震災アーカイブに加えてそれらも本研究の中心的な対象として研究を進めることとした。以下、先述の主要研究課題に基いて述べる。課題1:震災アーカイブに関して、第3者による非高品質なメタデータを基礎としつつ、利活用性を高めるための手法が中心課題である。ここでは主題語の共起関係によるメタデータ集約、メタデータから取り出した地域の組織や施設等を表す語に基づく地域指向のオントロジーや地理的実体のLODデータの作成を行い、一定の成果は出したがこれら全体をまとめることは次年度に残されている。文化的コンテンツについては、それぞれの領域で基本的なメタデータ集約のためのモデルを開発し、かつ国際連携も行っている。課題2:津波ディジタルライブラリ(TDL)の研究グループとの連携を進めた。TDLのテキストと前述の地理的実体LODを利用することで過去の災害とのリンク付けに関する研究を進めることができると考えている。文化的コンテンツについては、これまでの成果が、マンガ等を中心としたWebリソースと文化庁のメディア芸術データベースとの結びつけ、国際連携によるモデルの精緻化と発信につながると考えている。課題3:TDLの利用を進めること、デジタルアーカイブネットワーク(DAN)等を利用した実務者と結びつく活動、メタデータ作成や編集におけるクラウドソーシング技術の利用に関わる研究等をコミュニティ連携に関わる研究として進めたいと考えている。また、国内外の研究者との連携、海外発信については想定以上に進んでいると考えている。
著者
森嶋 厚行 川島 隆徳 原田 隆史 宇陀 則彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 人文科学とコンピュータ研究会報告
巻号頁・発行日
vol.2015, no.13, pp.1-4, 2015-05-09

近年,クラウドソーシングは問題解決の新しいアプローチとして注目を集めている.本講演では,クラウドソーシングの応用事例として,クラウドソーシングプラットフォーム Crowd4U を用いた NDL データ利用プロジェクトについて説明する.Crowd4U は,非営利・公益・学術目的のクラウドソーシングプラットフォームであり,公益と学術のタスクが稼働している.Crowd4U は大学によって開発が行われており,プロジェクトの要望に応じて様々な機能追加が日々行われている.L-Crowd プロジェクトは,Crowd4U 上で NDL データを用いて行われているプロジェクトの一つであり,ISBN による書誌同定における誤り (書誌誤同定) の判定をマイクロタスクで行おうというものである.本講演では,本事例の紹介を通じて,クラウドソーシングを利用した公益・学術プロジェクトの可能性を議論したい.
著者
森嶋 厚行
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

本講演では,クラウドソーシングシステムの実現に必要な要素機能を提供するクラウドソーシングプラットフォームCrowd4Uについて紹介する.Crowd4Uの特徴は,非営利・公益・学術のためのクラウドソーシングプラットフォームであると同時に,その上でのクラウドソーシングプロジェクトやCrowd4Uプラットフォーム自体が研究の対象となっており,高度クラウドソーシング技術の実験場として利用可能な事である.
著者
松本 明 森嶋 厚行 北川 博之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.67, pp.83-90, 2002-07-18

既存のXML問合せ言語や操作系では,ユーザはテキストエディタや視覚的操作系を用いて問合せを直接記述する.我々はこれらとは全く異なるアプローチのXML操作系であるXLearnerの研究開発を行っている.XLearnerは,サンプルのXML要素に対するユーザの例示操作からシステムがXQuery問合せを推論する.構造化データであるRDB等と異なり,例示操作に基づくXQuery問合せ推論は自明ではない.XLearnerはXQuery問合せに対するシステマティックな推論機構を提供する.XLearnerを用いた問合せ推論過程では,ユーザとシステムのインタラクションが必要となる.本稿では,本推論機構の概要,および,問合せ推論に必要なインタラクション数に関する実験結果について報告する.Existing XML query languages are textual or graphical languages in which we can specify queries for XML manipulation. This paper explains XLearner, a different kind of manipulation framework for XML. XLearner infers XQuery queries based on operations of sample XML elements. Inferring queries for XML is a non-trivial task, because XML is a kind of semistructured data, in contrast to relational databases whose data structure is completely regular. XLearner gives a systematic way to infer XQuery queries. The algorithm requires interactions between the system and the users. The paper reports an overview of its inference mechanism and experimental results on the number of required interactions.
著者
油井 誠 森嶋 厚行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.44, no.12, pp.11-22, 2003-09-15
被引用文献数
3

我々はオープンソースのRDBMSであるPostgreSQLとそのXML拡張であるXMLPGSQLを利用し,多機能なXMLデータベース環境を構築した.本環境ではXMLをPostgreSQLに格納し,XMLとしてアクセス可能なインタフェース群を提供する.本環境が多機能であるとは,次の機能をすべて持つことを指している.(a)DOM準拠関数によるアクセス機能,(b)XPathによるアクセス機能,(c)格納されたXMLの更新機能.機能(a),(c)はすでにXMLPGSQLが提供しているので,構築にあたっては特に機能(b)の実装を行った.また,この機能の追加にともない,機能(c)の変更も行った.本論文ではこれらについて説明する.本論文の貢献は,研究コミュニティが開発した成果などを,オープンソースRDBMSに適用した事例を示すことである.本環境はさらに次の特徴を持つ.(1)現在まで別々に行われていた研究や開発の成果などを組み合わせ,多くの機能をそれ1つで提供するオープンソースの環境を提供する.(2)研究プロジェクトではあまり重要視されてこなかった詳細機能の実装も行う.(3)PostgreSQL専用とし,構築にあたってはユーザ定義関数などの,必ずしもすべてのRDBMSがサポートしていない機能も利用する.We developed a multifunctional XML database environment using PostgreSQL, an opensource RDBMS and XMLPGSQL, an XML extension. The environment decomposes XML documents into fragments and uses PostgreSQL to store them in a set of relations. Users do not have to know that they are stored as relations. It provides a variety of means to access XML documents; (a) DOM functions to build and traverse XML documents, (b) XPath engine to extract information from documents, and (c) update functions to modify documents. Since XMLPGSQL provides functions (a) and (c), our focus was on development of function (b) and modi fications of funcion (c). Our main contribution is to show a case where we applied the fruits of research and development activities to an opensource RDBMS. The features of the projects are as follows: (1) we combine separately-developped technologies to construct one integrated environment providing multi-functionality, (2) we implement details that tend to be ignored by research prototype systems, and (3) we do not hesitate to use PostgreSQL's features (such as user-de fined functions) to construct the environment.
著者
只石正輝 森嶋 厚行 田島 敬史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.229-234, 2008-09-14

今日, XMLや RDF 等のエッジラベル付き有向グラフが生成,蓄積されている.また,生成,蓄積されるグラフは大規模となってきており,グラフに対する効率的な管理/検索が重要な問題となってきている.本論文では,大規模なグラフに対する問合せの一つである子供/子孫問合せに着目し,それらの問合せを効率的に処理するためのノード格納方式を提案する.Today, we have many edge-labeled directed graphs such as ones written in RDF and XML. Because the size of such graphs is getting larger, efficient processing of queries against graphs is important. This paper proposes a novel node storing scheme for the efficient processing of child/descendant queries.
著者
杉本 重雄 逸村 裕 佐々木 秀康 永森 光晴 原 正一郎 池内 淳 上保 秀夫 阪口 哲男 新保 史生 鈴木 誠一郎 柊 和佑 森嶋 厚行 吉村 和真
出版者
筑波大学
雑誌
基盤研究(A)
巻号頁・発行日
2010

ネットワーク環境におけるコンテンツ情報基盤に関する総合的取組として(1) ディジタルアーカイブの連携性向上のためのメタデータスキーマレジストリ技術(2) 図書館,文書館等における頑健なディジタルアーカイブのためのメタデータモデル(3) ディジタルマンガ等の新しい形態のコンテンツのためのメタデータモデル(4) これらを総合的にとらえたディジタルアーカイブ間連携等の課題に関する研究を進め, 公開シンポジウム等の機会も通じて, ネットワーク環境におけるディジタルアーカイブの相互運用性, 利用性向上のための情報基盤に関する知見を得た。