著者
原田 隆史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.51, pp.197-204, 2003-05-22
被引用文献数
2

文化的価値のある情報メディアのうち,Webページおよびテレビニュースを対象として,体系的保存のための組織的な取り組みを紹介する。近年,Webページは作成される数の増加にともなって情報源としての重要性が高まっている。Webページには短期間で消失するものや更新されるものが多く,重要性の高まりとともに,その保存の必要性が高まってきている。このようなWebページの保存は米国のThe Internet Archiveをはじめとして米国や北欧諸国の国立図書館で近年盛んに行われるようになってきている。また,テレビニュースアーカイブは映像と文字をあわせもつ貴重な情報メディアであるが,日本ではほとんどその保存活動が行われていない。ここでは,米国のVanderbilt UniversityのTV News ArchiveやCNN Television Archive BBC Television News Archiveなどを紹介し,日本における活動のための基礎的な資料を提供する。This paper describes the activities of systematic archiving projects of web pages and TV news among the information media which is culturally valuable. In recent years, web pages have been becoming more and more important as information resources as the growing numbers of them have been made. Many of them, however, are not existed so long or are updated soon, archiving them has become urgently necessary. The archiving projects of web pages, e.g., The Internet Archive, have been done lately in the national libraries in the United States and Scandinavian countries. TV news also is valuable information media containing both images and characters. This paper introduces Vanderbilt University Television News Archive, CNN Digital Archive, National Film and Television Archive etc.
著者
田中 浩也 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.407-412, 2003-07-16

デジタルスチルカメラや携帯電話内蔵型カメラの普及に伴い,多くのユーザが写真画像を大量に撮影するようになった.そのため蓄積された写真画像を高度利用するためのさまざまシステムが検討されている.筆者らは,近い位置で撮影した写真画像をリンクで互いに繋ぎ合わせる方法に基づく「ハイパーフォト空間」の提案を行ってきた.ハイパーフォト空間は,写真を空間的にリンクで結びつけるだけの比較的簡易な機構であるが,ユーザが短時間で擬似3次元空間を制作できる点が特徴である.ハイパーフォト空間はまた,個々のユーザが「写真」と「リンク」を用いて現実のある空間を再構造化した結果と見なすことができる.そのため制作されたハイパーフォト空間を分析することで,ユーザの主観的な解釈を経た現実空間の状態を把握し,建築や都市分析に応用することが可能と考えられる.そこで本稿では,幾何構造に基づいてハイパーフォト空間の特徴を抽出する方法をまとめ,それらの手法を用いたハイパーフォト空間分析の基礎的な実験結果を示す.We have proposed the concept of "HyperPhotoSpace", one of pseudo-3D virtual spaces composed of photographs and spatial-hyperlinks. By using our prototype system STAMP/PhotoWalker, a user can create HyperPhotoSpace easily and present their own spatial experiences. In this paper, we discuss several basic methods for feature extraction of HyperPhotoSpace. Moreover, we also introduce one sample analysis of HyperPhotoSpace. To analyze HyperPhotoSpace, it is possible that we figure out both the structures of the real place and users' personal interests in the space.
著者
山名 早人
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2004, no.45(2004-DBS-133), pp.107-110, 2004-05-14

インターネット上のWWWサーバから発信される情報量は膨大であり、2004年4月時点で、テキストデータだけでも92.5億ページと推測される。また、2002年?2003年の増加傾向をみると、Webページは今後も1年間におよそ10億ページずつ増加を続けると予想される。このような膨大なWebページには、人間が一生かかっても学ぶことのできない情報、知識、ノウハウが凝縮されていると言っても過言ではない。本稿では、このような膨大なWebデータをどのように収集し更新すべきか、そして、このような膨大なWebデータをどのように有効活用すべきかについて、いくつかの研究事例を紹介すると共に、新しい利用法について考える。
著者
財部 倫孝 清水 將吾 石原 靖哲 伊藤 実
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.10, pp.61-68, 2000-01-24

従来の確率的データベースモデルは,データベース中の各タプルに対して実際にそのタプルが存在する確率を付加するというものが一般的であった.しかしこのようなモデルではタプル間の依存関係,例えばある二つのタプルの少なくとも一方がデータベース中に存在するという関係にあることを表現できない.そこで本稿では,Imielinskiらによって提案されたconditional tableを基本的枠組として採用し,conditional table中に現れる各変数を確率変数として扱うことによって,タプル間の依存関係を表現できるような確率的データベースモデルを提案する.In the conventional models of probabilistic databases, the probability of existence of each tuple is attached to the tuple. However, these models are not able to represent dependency among tuples, e.g., there is at least one tuple in a database. In this paper, we propose a probabilistic database model which is able to represent dependency among tuples. For that purpose, we adopt conditional tables proposed by Imielinski et al. as a standard framework, and treat each variable which appears in a conditional table as a random variable.
著者
蓬莱 博哉 灘本 明代 田中 克己
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2003, no.71(2003-DBS-131), pp.265-272, 2003-07-16

これまで我々は,「容易に」「楽しく」「片手間に」Webコンテンツを取得するために,Webコンテンツを放送型コンテンツに変換してきた.本論文では,この放送型コンテンツをより親しみのあるコンテンツに変換することを目的とし,Webコンテンツを対話型番組に変換することを行う.本論文で提案する対話型番組とは漫才を用いた放送型コンテンツの事である.Webコンテンツを漫才に変換することにより,幅広い年齢のユーザ層にとって内容の理解を容易にするとともに,これまでWebコンテンツ取得時に必要であった能動的操作を軽減する事が可能となる.そこで,本論文ではまず漫才の形式化に取り組み,Webコンテンツから漫才形式に基づいた対話型番組に自動変換する機構を提案する.
著者
森本 卓爾 橋本 健二 石原 靖哲 藤原 融
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.65, pp.109-114, 2007-07-02

本稿では XPath 部分クラスの問い合わせを、木埋め込み関係に基づいた XML スキーマ進化に応じて正しく変換する手法を提案する。正しい変換とは、進化前スキーマに従う XML 文書に対する問い合わせ結果と、進化後スキーマに従うように変換した任意の XML 文書に対する問い合わせ結果が等しい変換を言う。提案した手法が正しい変換を行っていることを証明する。A method is proposed for translating queries in a subclass of XPath according to XML schema evolution based on the tree-embedding relation. A query translation is said to be correct if the result of every query to an XML document valid against the schema before evolution is equal to the result of the translated query to the XML document valid against the schema after evolution. Correctness of that the translation method is correct is proved.
著者
八木 哲 高橋 直久
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.3, pp.17-24, 2002-01-21
被引用文献数
1

本稿では,広域分散した地点で観測される頻繁に変化する情報を,リアルタイムに広域で共有するためのシステムであるWISE(Wide-area Information Sharing Engine)について述べる.例えば,道路交通情報,地域情報,気象環境情報,ネットワーク情報,計算機リソース情報が対象となる.これらの情報を,端末の種別や場所を問わずにシームレスに利用可能にすることで,計画からドアtoドアまでのナビゲーションサービス,ネットワークの可用性情報サービス,グローバルコンピューティング向けの計算機リソース情報サービスなど,多様な情報ナビゲーションのための基盤を実現する.WISEはRM(Resource Manager)と呼ぶ自律型モジュールの集合体であり,`抽象化した情報'を利用して,情報に対する参照と更新の負荷を共に各RMに分散,局所化,あるいは抑制する.本稿ではWISEの構成を示し,WISEを構成するデータベース系と情報交換系のうち,データベース系の設計を示すとともに,例題にてらして有効性を考察する.This paper presents the WISE (Wide-area Information Sharing Engine) which is the real-time sharing system for dynamic and globally distributed information. For instance, dynamic and globally distributed information is road traffic information, network traffic information, meteorology information, environmental information or load information of distributed computing resources. WISE supplies these information to any device at everywhere seamlessly for any navigation service. For the purpose, WISE is constructed with a group of autonomous elements named the RM (Resource Manager) and uses the abstracted information to distribute and localize the load of reference and update to each RM. This paper describes a design and a case study.
著者
白田 由香利
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.1-8, 2003-07-16
被引用文献数
2

本稿では,e-Learningシステムにおいて学習者の学習履歴データをデータマイニングする場合どのような相関ルールが抽出されるべきであるか、を考察する.e-Learningシステムにおいて学習者がシステムの提示したドリル問題に対して不正解であった場合、システムは学習者の状況を、データマイニングによって発見されている相関ルールを用いて判断したい.そのためには予め、有益な相関ルールを膨大な学習履歴データベースからデータマイニングで抽出しておくことが必要である.本論文では、個々の学習キーワードが単独で出現するドリルであれば解けるのであるが、学習キーワードが複合化して出現した場合にはドリルが解けなくなる、という状況を発見するために有効な相関ルールとはどのように定義すべきであるか、について考察する.我々の提案する設定問題は、従来のデータマイニングのバスケット解析などとは本質的に異なり、新たな抽出技法が必要となる.その技法について考察する.In the paper, we discuss which kind of association rules are effective for the data mining on an e-Learning system learner's learning transaction database. The data mining system, in advance, finds effective association rules from the learning transaction database. By using the association rules, the e-learning system detects the learner's stalled and analyses its reasons. In particular, the stalled situation in which the learner understands individual keywords separately but the learner cannot solve a problem that involves comound keywords is the target of our study. Our proposed problem is differnt from the exixting assocoation rules for market basket analysis problem. Then the new solving methods are required. In this paper, the methods are also discussed.
著者
中田 充 宝珍輝尚 都司 達夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.38, pp.1-8, 1997-05-13
参考文献数
9
被引用文献数
3

サイエンティフィックデータベース管理システムDREAMのデータモデルであるDREAMモデルでは,データはデータエレメントと呼ばれる要素に格納される.名前付きエレメントはデータに名前を付けるための要素であり,視点はその集合として定義される.さらに,オブジェクトは視点の集合であり,オブジェクトの集合はバンドルと呼ばれる.この内,名前付きエレメント,視点,オブジェクト,バンドルの基本的な構造は(識別子,名前,集合)の3つ組である.この3つ組のことを名前付き集合と呼ぶ.本論文では,まず名前付き集合に関してその構造や演算を定義し,名前付き集合を用いた名前付き集合モデルを提案する.そのあと,名前付き集合モデルを用いてDREAMのデータモデルの定義を行う.DREAM model is a data model for a scientific DBMS DREAM. In DREAM model, data is stored into a data element. A named element is to relate a name with data elements. A set of named elements is called perspective. Furthermore, an object is a set of perspectives, and a set of objects is called a bundle. Structure of every DREAM element except data element can be treated as a triplet (id, name, S), where id is the identifier of the triplet, name is the name of the triplet and S is the corresponding set of DREAM elements. We call this triplet as the named set and the data model employing these triplets as the named set model. First, this paper proposes a named set model including unified operations on the triplets. Secondly, it defines the DREAM model using the proposed named set model.
著者
小町 祐史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1994, no.86, pp.193-200, 1994-10-13

1994年9月13日にニースで開催されたIEC/ISO/ITUマルチメディアオーブンセションの内容を紹介する。開催までの経緯として,IECマスタープランによるマルチメディアの位置付けがあり,規格協会マルチメディア調査検討委員会による技術セミナーの開催提案,その後のIEC,ISOによる共同開催への合意がある。総会と同じニースのアクロポリス会場で行われたオープンセションには,予想を上回る参加者があり,18件の講演とそれに関する議論が17時過ぎまで行われた。マルチメディアの標準化活動は,関連標準化機関による調整と整合が必要であることが確認され,調整機構の設立が提案された。IEC/ISO/ITU Multimedia Open Session was held in Nice, Sept 13, 1994. This paper reports the conference, As the background, IEC clarified the inportance of multimedia standardization in its master plan. Corresponding the plan, the Multimedia Study Group, Japan madea proposal of technical conference and there was an agreement between IEC and ISO on holding a joint conference. There were much more numbers of attendance than expected in the Open Session. Acropolis in Nice. Seventeen presentations and discussions continued up to half past 17:00. As conclusion, the requirements for coordination and harmonization amongst related standardization organizations was recognized and the establishment of a coordination mechanism was proposed.
著者
青木 伸也 湯本 高行 角谷 和俊 新居 学 高橋 豐
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.187-192, 2008-09-14
参考文献数
7

本論文では,同一事件を扱ったニュース記事集合内の特異な段落に注目し,発信者意図を抽出する手法を提案する.発信者意図は言及特異段落の集合と,不言及特異段落の集合から構成され,複数発信者間の意図の違いを表現する.これにより,ユーザのニュース記事の読み比べを支援することができる.本提案手法では,段落の言及,不言及特異度を定義し,閾値より大きいものを抽出する.評価実験では,適合率は平均 0.69 と比較的良い値が得られたが,再現率は平均 0.53 と低く,課題が残った.In this paper, we propose the method to extract author intentions based on peculiarity parts in related news articles. An author intention consists of mention peculiarity paragraphs and non mention peculiarity paragraphs, and expresses difference between intentions of some authors. This will support users to read and compare between news articles of some authors. In this proposed method, we define mention peculiarity and non mention peculiarity of paragraphs, and extract paragraphs having peculiarity more than a threshold. In experimental results, average precision was 0.69, and average recall was 0.53.
著者
今井 小帆里 倉林 修一 清木 康
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.151-156, 2008-09-14
参考文献数
9

音楽データを対象としたデータベースの実現において,楽曲中の時間軸に沿って表現されたデータの物理的な特徴量や,感性的な印象,構造的な意味を,利用者が検索対象の楽曲を理解しようとする意図や視点に応じて計量する機構の実現が重要である.本稿では,楽曲を特徴づける物理量や,そこから発生する感性的な印象をユーザの要求に応じて分析し,楽曲の内容を対象とした検索やデータの閲覧を支援する機能を有する音楽データベースシステムの実現方法を示す.本システムの特徴は,音楽理論における音楽構造分析の手法や,音楽心理学,および,色彩心理学の研究成果をメディア分析関数群として実装し,それら分析関数を用いて楽曲データの内容変化をデータベースが自動的に解釈する機能を有する点にある.本システムの利用者は,音楽データベース問い合わせとともに,検索対象楽曲を理解しようとする意図や視点として様々な分析・可視化関数の組み合わせを発行し,それらに応じた検索・可視化結果を得ることが出来る.本稿では,クラシック楽曲を対象とした検索・可視化機構の実現方法を示し,本システムの実現可能性,および,有効性を評価する.A large number of music resources are provided in the world-wide scope. In this paper, we propose a novel music database system equipped with a musical knowledge base that assists database processing automatically by providing formal intelligence about music. The musical knowledge base sets appropriate parameters for database processing. It offers an easy and intuitive mechanism for general users to retrieve musical compositions. One of the most significant advantages of our database system is that it supports various combinations of media analysis functions that are stored in the knowledge base. This system makes it possible to express users' intensions to retrieve music data as a combination of query sequence and its interpretation methods. We show several experimental results to clarify the feasibility of our method.
著者
堀 憲太郎 大石 哲也 峯 恒憲 長谷川 隆三 藤田 博 越村 三幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.56, pp.81-88, 2008-06-12

本稿では,ユーザのクエリから,その意図に沿った拡張クエリを作成する際に,Web 上で最大の百科事典である Wikipedia を用いるシステムを提案する.Wikipedia からの拡張クエリの抽出には,関連単語提案アルゴリズム[1]を用いる.関連単語提案アルゴリズムとは,あるキーワードとそれに関連するテキストが与えられた時,テキスト内で出現する単語間の距離に着目して,与えられたキーワードに関連し尚且つ重要と思われる単語を抽出するアルゴリズムである.このシステムを Web 検索時に用いることにより,クエリ拡張し,ユーザの目的とする文書を見つけるための支援技術とすることを目的としている.In this paper, we propose a method to extend the original query by applying a related word extraction algorithm to Wikipedia that is an encyclopedia. The algorithm extracts words related to given key words from any text and calculates a score for each extracted word according to distance between words in the text. The method helps users to obtain their desired documents in web search by extending a query with highly scored words.
著者
高野 元 久保 信也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.10, pp.9-16, 2000-01-24
被引用文献数
7

本報告は、WWW検索用のランキングシステムであるサイテーション・エンジンの機能と構成について述べる。現在のWWW検索の問題は、一つ一つのページを独立した文書として扱っていることであると考え、ユーザに提示すべき検索結果は個々のページの重要度ではなく、WWWサイトの構成を反映したものにすべきと考えた。サイテーション・エンジンは、WWWページ間のリンク構造を解析することによって、上記機能を実現する。サイテーション・エンジンはWWWクローラが出力するリンク情報をデータベースに格納し、これを解析する。解析機能は、リンク参照関係を用いた重要度(ページランク)計算機能と、WWWページ間の関連を用いた情報構造(インフォメーション・ユニット)解析機能からなる。さらに、ここで得られたページランクとインフォメーション・ユニット情報に基づいて、検索結果を並べなおすリンク構造ソート機能を備える。これにより、全文検索エンジンと連携して、高度なランキング機能を備えたWWW検索システムを構成できることを、プロトタイプシステムによって確認した。This report describes functions and configuration of a ranking system for the WWW search engine, which we call "Citation Engine". We have figured out the problem in the WWW search system that the system treats each WWW page as an independent document. Therefore, the ranking method in the system should consider a structure of pages in a site. According to this consideration, "Citation Engine" was designed to give better ranking by using link analysis techniques. "Citation Engine" stores and analyzes whole link structures that are fetched by the Web Crawler system. There are two main analysis functions: (1) the page rank analysis, and (2) the information unit analysis. It also provides the structural sorting function, which organizes search result with information of the page rank and the information unit. The WWW search engine which gives well-organized search results can be build by integrating "Citation Engine" and the full-text search engine. Efficiency of "Citation Engine" is verified on a prototype system.
著者
中村 正規 塩澤 守弘 内山 恵三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.34, pp.1-7, 1998-05-14

日本のエネルギー政策にとって欠かすことのできない原子力発電をお客様一人一人に理解していただき、また、分かり易く情報を提供できるシステムが必要とされている。本稿では、インターネットを活用したマルチメディアコンテンツによるコミュニケーションシステムを提案する。このシステムは、情報発信者が、メディアの部品を組み合わせて奥行きのあるコンテンツを簡単に作成できる。また、作成したコンテンツは、自動的に関連情報とリンク付けされるので、利用者は、利用者の理解度、興味の対象に合わせてコンテンツをサーチすることができる。我々は、原子力発電所のパンフレットを題材にして原子力PAを試作した。奥行きのあるコンテンツは、従来のフラット構造のンテンツと比べて、利用者の理解を支援する効果が高められる。There are substantial needs among public utilities for the system that provides customers with the easy to understand information and facilitates their understanding and acceptance of nuclear power plants that are essential for the Japanese energy policy. This paper proposes a customer communication system that casts multimedia contents via the Internet. By using this system, users can edit multimedia components in an easy manner and make state-of-art contents that consist of layered components. In addition, the contents made with this system automatically generate lists of references to the related information, thus viewers can search the contents on the basis of their understanding and interests. We developed a demonstration system that facilitates public acceptance of nuclear power plants. We believe that our multi-layered system is significantly more effective in supporting customers' understanding than commonplace ones that are made up of single-layered contents.
著者
山口 実靖 小口 正人 喜連川 研優
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.72, pp.447-454, 2004-07-14

本稿ではiSCIを用いたIP-SANのアクセストレースシステムの提案と それを用いた性能向上に関する考察について述べる.FC-SANの欠陥を補うSANとしてTCP/IPとEthernetを用いるIP-SANやiSCSIが期待を集めるようになっているが,IP-SANの欠点としては性能がFC-SANより劣るとの指摘もありIP-SANの性能向上の実現が重要であると考えられている.iSCSIを用いたIP-SANシステムではサーバ計算機とストレージ機器が孤立に個別のOS等で稼動し,それらがTCI/IPネットワークを用いて通信を行い強調して動作し全体のシステムを構築することとなる.よって,これらの統合的な解析の実現が重要である.本稿では,我々の実装した統合的なトレースシステムについて説明を行い,それを実際に高遅延環境における並列iSCSIアクセスに適用し性能制限原因の発見および発見された問題の解決により並列iSCSIアクセスの性能を向上させられることを示す.In this paper, we propose an IP-SAN access trace system and present performance improvement using the system. IP-SAN and iSCSI are expected to remedy problems of FC-based SAN. In IP-SAN systems using iSCSI, service and storage work cooperatively by communicating with each other via TCP/IP, thus integrated analysis of servers and storage can be considered important. We explain our integrated trace system and show that the system can point out the cause of performance degradation.
著者
佐藤 和洋 田坂 光伸 山本 洋一 浪岡 美予子 茂木啓次
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1990, no.63(1990-DBS-078), pp.41-51, 1990-07-19

我々は、人間の知的活動、そしてそれに伴う意思決定の曖昧な情報処理及び管理を効果的に支援するためのファジィ情報処理機能について検討を進めている。その中で本稿では、データベースに対する問合せの曖昧性を対象としたファジィ情報検索システムINDAS/ffについて論じる。ファジィ間合せはSQLにファジィ述語を導入することで実現し、ファジィ間合せに対する新たな適合度評価方式を提案する。また、ユーザの情報取得過程のフォーカシングを効率的に支援するために、適合度分布に基づいた概略結果情報表現であるサマリボックスや、またその極め細かい適合度状態を表示する適合度マップ等からなる視覚的インタフェースVFN(ew Focusing Navigat)を提示する。
著者
佐藤和洋 金子格 中村史朗
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1982, no.41(1982-DBS-033), pp.1-10, 1982-11-18
著者
西岡 秀一 高田 智規 山本 隆二 阿部 剛仁 川村 春美 大村 弘之 有澤 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1989, no.63, pp.33-40, 1989-07-20
被引用文献数
3

本稿では特定の構造化を行っていない意味データベースから構造化されたオブジェクトを作り出すためのオペレータを定義する。このオペレータによりデータベースから利用者の求める構造化されたデータを取り出せるだけでなく、新たにデータを導出することができる。This paper proposes a framework of AIS semantic data model. The model is based on entity concept and "association", which maps an entity to a stream of entities in another set. The new operators listed here can generate structural "objects" from "flat" database.
著者
吉岡 真治 原口 誠 大久保 好章
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.41, pp.151-158, 2002-05-21

情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. Therefore, many IR systems have capability to modify keywords by estimating user's intent. However, since modified keywords are usually represented as complicated form, it is difficult to judge the appropriateness of them. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed to use the contribution value of each keyword for relevance judgement to select appropriate generalization. In addition, we confirm general concept structure stored in a thesaurus is not sufficient for representing particular user's intent. Therefore, we proposed a purpose oriented method to modify concept structure.