王波濤 牧之内 顕文 金子 邦彦
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1997, no.64, pp.69-75, 1997-07-14

本発表では,64ビット計算機の特徴と,その特徴を生かしたINADA/ODMGの64ビット化について報告する.INADAはメモリマップドファイル機能に基づくデータベースシステムである.従って,32ビット計算機版では一度に扱うのデタベス量に限界がある.64ビット化によりこの制限はなくなる.又,セコイヤ2000ベンチマークの実装についても報告する.In this paper, we discuss properties of 64 bit environment and the redesign of our 32 bit INADA/ODMG for 64 bit environment. INADA is a database system based on memory mapped files. INADA 32 bit version has the limitation of maximum data size. In 64 bit INADA, a very large database in disks can be mapped onto a large size virtual memory, practically without considering the size limitation. At the same time, we give our design of implementation on Sequoia 2000 benchmark on the extended INADA.
山家 雄介 中村 聡史 アダム ヤトフト 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.259-264, 2007-07-03

ソーシャルブックマークは、Web 利用者がブラウジング中に興味や関心を持ったページを記録、共有、分類そして発見することを支援する Web サービスである。本論文では、ソーシャルブックマークから各 Web ページのメタデータを抽出し、これを利用することによる Web 検索結果の対話的再ランキング法を提案する。我々はこの手法を実現するプロトタイプを実装し、そのインタフェースを中心に試験的な評価を行った。Social bookmarking services are an emerging type of Web services that let users store, share, annotate, and discover interesting resources. In this paper, we propose an interactive reranking method for web search results that utilizes social bookmarking data such as the number of bookmarks, timestamp, associated tags, sentiment expressions, etc. We demonstrate a prototype system that we have implemented and show some preliminary evaluation done in order to test our approach.
牛尼剛聡 渡邉 豊英
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.68, pp.469-475, 2005-07-14

本論文では,ライフログ検索に利用することを目的として,個人時間空間の要素に対してキーワードで索引付けを行う手法を提案する.デジタルカメラで撮影された画像をはじめとして,多くの種類のライフログは時間軸上に対応付け可能である.本手法で生成される索引を利用すれば,時間軸に対応付け可能なライフログを,人手によるアノテーション無しでキーワード検索可能となる.本手法では,索引の自動生成のために,個人が送受信した電子メールメッセージを利用する.本研究で対象とするのは,索引語と個人時間空間の要素間の関係である.本手法ではその関係を,(1) 索引語とメッセージの関係,(2) メッセージとメッセージ中に現れる時間表現の関係,(3) 時間表現と個人時間空間の要素間の関係,という3 種類の構成要素に分解する.そして,それぞれの構成要素に関して,局所的重み,大局的重み,正規化係数という3 種類の基準に基づいて重み付けを行う.This paper introduces a technique for making an index on a personal time space with keywords. The index made based on this technique is used for life-log search. Many types of life-logs such as a snapshot image taken with a digital camera can be assigned onto a personal time axis. A user can search such types of lifelogs can with keywords using such index without manual annotations. Our technique uses user's personal e-mail messages for generating an index on his/her personal time space. For generating an index, we have to consider the relationship between an index word and an element of personal time space. We divide the relationship into three sub-relationships. They are (1) the relationship between an index word and an e-mail message, (2) the relationship between an e-mail message and a temporal expression in e-mail messages and (3) the relationship between a temporal expression and an element of personal time space. Each relationship is weighted from three kinds of viewpoints: local weight, global weight and normalization factor.
白田 由香利 橋本 隆子 飯沢 篤志
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2000, no.10, pp.107-112, 2000-01-24

放送のデジタル化に伴い、映像情報の補足情報をインデックスとして付加し、そのインデックスを用いて映像のダイジェスト版を作成する場合、切り出したシーンごとの説明文を生成する機能が重要となる。我々はシーンごとの説明文の接続関係に着目し、全体としてつながりのよい文章を生成する方式を検討した。また、従来検索結果の提示方式は中立的立場の表現をとっていたが、本方式では個人の嗜好を指標としてその人の感情表現、つまり嬉しさ度悲しさ度を加味した表現を生成する。Beyond program contents, digital data broadcasting can deliver additional data as indexes attached to the contents. Using these indexes, we can construct a digest of the program and generate an explanation for each extracted scene. We focus on the relationship between scenes to create conjunctive expressions. With conjunctives, the explanations become more natural for users. In addition, we also generate emotional expressions for the explanations. While the current method outputs neutral expressions, our new method generates an expression including the hapiness or sadness level based on the user preferences.
宮森 恒
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.41, pp.9-16, 2002-05-21

本稿では,動作インデックスによる映像の自動注釈付けと,それを利用した柔軟な内容検索システムについて報告する.応用例としてテニスを考える.目的は,スマッシュなど一選手の単独動作だけでなく,ネットダッシュするといった複数選手・複数動作からなる,より一般的な特定動作を検索することである.まず,入力映像・音響データから,コート・ネットライン,選手・ボール位置,選手によるボール打撃時刻を抽出し,これらを総合的に評価してフォアハンドスイングなど選手基本動作インデックスを出力する.次に,予め定義済みの動作成立条件とすでに出力された基本動作・一般動作インデックスを評価し,新たに一般動作インデックスを出力する.実験の結果,動作成立条件の再定義と更新により,さまざまな一般動作を柔軟に追加・検索できることを確認した.This paper presents automatic video annotation method based on action indices and its application to flexible content-based retrieval system. Our test domain is tennis. The goal here is to retrieve not only simple actions by single player, such as smashing, but also more general actions composed of several players and actions, such as "net-dashing". First, input video and audio data are analyzed to extract court-net lines, positions of players and the ball, and the moments a player hits the ball. These data are totally evaluated to output basic action indices by each player, such as forehand swings. Then, the predefined conditions to satisfy a certain general action, and the already generated basic and general action indices are evaluated to output new indices of the corresponding general action. Experimental results show that redefinition and updates of conditions for a specific general action enable the system to append and retrieve various kinds of actions flexibly.
成田 宏和 太田 学 片山 薫 石川 博
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.375-382, 2002-07-18

Web上で必要な情報へのアクセス手段として、中心的な役割を担っているのがgoogle goo Lycosなどに代表されるロボット型Web検索エンジンである。これらの検索エンジンが日々変化し続けるWebに対応していく為には、新しいページの収集、更新チェックなど多大なメンテナンスを必要とする。一方で、検索結果があまりに膨大すぎて必要な情報を探すのに困難を伴う場合もあるし、全ての検索エンジンが同一の情報を収集しているわけではないので、或る検索エンジンでは存在しなかった情報も別の検索エンジンを利用すると発見できる場合もある。本稿では、検索能力の強化と発見しにくい情報へのアクセス支援を目的に、複数の検索エンジンを併用し、検索結果を階層的にクラスタリングしてユーザに提供するシステムであるMETALを提案する。It is search engines represented by google, goo, Lycos, and so on that shoulders a leading role as an access means to the necessary information on the Web. A lot of maintenance, such as collection of new Web pages and renewal check, is necessary for these search engines to cope with the Web changing continually. On the other hand, sometimes, it is difficult to find necessary information because of enormous search results. One search engine may be able to find what another can't because different search engines collect different kinds of information. In this paper, we propose a meta search engine which uses more than one search engine at the same time for improving recall, and cluster search results for supporting users to find their necessary information more easily.
市川 哲彦
vol.1994, no.62, pp.201-208, 1994-07-20

純枠な関数型プログラミング言語Haskell向けに,monadを用いた実行順序制御と多重定義関数を基本操作とするデータベース操作インターフェースを設計・実装した.データベース操作はすべてmonadによって制御されているので,参照透過である.また,基本操作をPersistent classに関連付けられた多重定義関数として定義することにより,実装の詳細を隠蔽するデータ独立性を実現し,多様関数と静的型付けの利用とを可能にしている.In this report, we describe the implementation of a simple database manipulation scheme for non-strict purely functional programming language Haskell. Evaluation of database actions is controlled in a monadic way. Hence, all database manipulations are referentially transparent. The primitive operations are defined as overloaded functions associated with a newly introduced class Persistent. The class hides all the implementation details to achieve data independence, and utilizes polymorphic functions and static type checking, which are the major features of the language.
中山 浩太郎 原 隆浩 西尾 章治郎
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2008, no.56, 2008-06-12

Wikipedia は知識抽出のための有用なコーパスとして,人工知能や情報検索,Web マイニングなどの研究分野で最近急速に注目を集めている.筆者らの研究グループでは,Wikipedia から高精度な大規模連想シソーラスを構築できることを証明してきたが,is-a 関係などのような,より明確な意味関係の抽出が技術的課題であった.本研究では,リンク構造解析による重要文抽出と,自然言語処理を利用した解析手法を提案し,意味関係を抽出することで,Wikipedia から機械可読な概念辞書を自動的に構築することを目指す.The fact that Wikipedia is an invaluable corpus for knowledge extraction has been confirmed in various research areas such as AI, IR and Web Mining. In our previous researches, we have proved that we can extract a huge scale and accurate association thesaurus from Wikipedia. However, to construct a Web ontology from Wikipedia, extracting explicit relation types is a remaining technical issue. In this paper, we propose a method to construct a Web ontology from Wikipedia based on parsing and link structure analysis.
手塚太郎 李龍 高倉 弘喜 上林 弥彦
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.503-508, 2002-07-18

World Wide Web(以下、WWW)は日常的な情報収集の手段として広く用いられているが、地域関連情報の検索はその重要な一角を占める。本研究ではWWW上のテキストデータに対する内容解析によって人間の地理空間認知の構造を明らかにし、地域情報検索の効率化に役立てる。自然言語において地名は格助詞を伴って現れることが多い。そこで格助詞の意味分析を行ない、共起しやすい格助詞の種類によって地名を特性付けした。地名には狭義と広義のふたつの意味を持つものが多く、解釈において困難を生じさせているが、その判定に格助詞との共起パターンを用いられることを示した。World Wide Web is now widely used as a tool for daily information search. One important usage of WWW is to search local information. Our paper discusses human cognition on geographic space. In Japanese text data, most place names appear with case intensifying particles. We performed analysis on case intensifying particles and characterized place names based on which particles it is likely to co-occur with. There are many place names that have more than one meaning: the original meaning and the extended meaning, which surrounds the original. We showed that the characterization based on case intensifying particles could be used to determine such duplication of the meaning.
倉島 健 手塚 太郎 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.67, pp.47-53, 2005-07-13

人間の行動は時間的・空間的要因によって規定されている.Blogの普及により,地域を実際に体験した個人の情報発信が活発になり,さらには記述された日時が記録されているというBlogの特性によって,このような人間の動きに関する情報が得られるようになった.本研究においては,ある場所について書かれた個々のテキストから,人々の体験を,時間・空間・動作・対象属性間の相関ルールマイニングによって抽出する手法を提案する.そして,ユーザがそれらの属性を指定することで,抽出した体験を柔軟に検索・要約することのできるシステムの提案を行う.これにより,容易にその地域における人々の行動を把握することが可能となる.The prevalence of Blogs has enabled observation of the personal experiences in a certain location and time. Such information were traditionally unavailable except indirectly through local newspapers and periodicals.This paper proposes a method of obtaining spatially-specific experiences of urban visitors, for example, visitors' activities at several sight-seeing spots and their evaluations, by extracting association rules from the contents of Blog articles.By geographical mapping of Blog articles, the proposed system enables users to observe visitors' real activities and impressions of their visiting places, which are often more diverse than the guidebooks and more trustworthy than the advertisements.
粂照宣 鵜飼 孝典 西野 文人
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2006, no.9, pp.1-6, 2006-01-26

企業などの組織では,業務上のフォーマルなコミュニティ(プロジェクト) 以外にインフォーマルなコミュニティが存在する.このコミュニティは,プロジェクトメンバが作業を円滑かつ効率的に進めるために重要な役割を果たしている.また,組織運営として,その実態を把握しておくことで,プロジェクトの状況把握,担当者への作業指示や人材・資源の投入などを効率的に行うことができる.しかしながら,このようなインフォーマルなコミュニティは,プロジェクトメンバの作業状況やプロジェクトの進捗状況の変化にあわせて,時々刻々できては消えて行くために,その実態を把握することは困難である.また,特に大きな企業では,その存在を発見することすら困難である.本稿では,様々に変化するコミュニティのある時点の状況を予定表のデータから抽出する方法を提案し,実験結果を報告する.In an enterprise organization, a lot of informal communities exist besides formal communities,like as projects, on the business. The communities are playing important roles so that the project's members may proceed work smoothly and efficiently. And the managers can understand the project status, instruct person in charge about the job and manage person and the resource efficiently by understanding the realities. However, it is difficult to understand the real status of informal community, because it may be variable by member's job change and the progress of the project. Moreover, it is difficult in an especially big enterprise even to discover the existence. In this paper, we proposes the method of express the situation of point with the informal communities from the the schedule data, and we describe the experiment result.
朱成敏 遠山元道
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2004, no.71, pp.47-54, 2004-07-13

ISO/MPEGグループが提案したXMLに基づくMPEG-7はマルチメディアコンテンツを記述するメタデータの標準になった。MPEG-7はユーザが必要とするマルチメディアデータに付随する多種多様なメタデータを記述しているため、データの量が膨大になる。MPEG-7はXMLに基づいた文書なので、データの量が増加するほど、XMLパーサによる処理が増え、検索に多大な時間を要する結果となってしまう。そこで、本研究ではMPEG-7文書の検索を高速化るためMPEG-7が持っている情報の特徴を利用し、距離計算を通じて効率的な索引アルゴリズムを提案する。MPEG-7 is an ISO/IEC standard being developed by MPEG, and aims to create a standard for describing the multimedia content data that will support various multimedia search and retrieval applications. However, since it is described with text-based XML, it is very hard to efficiently search the documents on multimedia contents describe in MPEG-7 if the size of the documents an efficient indexing algorithm on MPEG-7 documents on video data. It first analyzes the some requirements on MPEG-7 documents indexing mechanism, and secondly proposes an indexing algorithm that clusters the Visual Descriptor values in MPEG-7 documents into several levels according to their distributions. This clustering helps to reduce the search range by just comparing the Visual Descriptor values of query video with the pre-computed similar Visual Descriptor values of target videos. This thesis also experimentally shows that the performance of the indexing algorithm is dependent on the number and granularity of the levels, and their values could be computed easily. The proposed indexing algorithm could be used to develop a large video archive system in which the contents on multimedia are described in MPEG-7.
平島 大志郎 勅使河原 可海
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.6, pp.25-30, 2007-01-25

本研究の目的は,企業や大学で行われる会議で運用されるシステムとして,発表者に対し有益なテキスト発言録を協調して作成できるシステム,CollabMinutesを確立することである.発言録をリアルタイムにテキストで記録することは記録係に少なからず負担を強いることになるために,このシステムを継続的に運用するためには,記録係の負担を軽減することが必要である.そこで我々は,既存システムのテキスト協調記録方式を分析し,用いるのに望ましいテキスト協調記録手法の検討を行った.また発言者名の記録手法に関しても検討し,その機能をCollabMinutesに実装した.開発されたCollabMinutesは評価の結果,記録された内容は量的な向上だけでなく質的向上も確認することが出来,発言者名を記録する手法に関しても4割以上の労力の削減が出来た.本稿では,CollabMinutesの開発から運用,評価について述べる.The objective of this research is to realize a meeting supporting system, which is named CollabMinutes, in a company or a university for making meeting minutes collaboratively by using texts. Because real-time voice comments recording work needs much labor for comments takers, it is necessary to reduce the labor for continuous system use. Therefore, we analyzed existing systems for collaborative minutes making, and we considered a much better approaches for our system. We also considered a efficient method of adding speaker names, and implemented it in the CollabMinutes. In results, we can find not only quantitative, but also qualitative increase in the recorded contents. In addition, we can reduce labor more than 40 percent for adding speaker names by using our method. In this paper, we describe system development and operation of the CollabMinutes. Moreover, we evaluate its validity.
石橋 直樹 清木 康 中神 康裕 佐藤 聡
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2003, no.71, pp.529-534, 2003-07-16

高域ネットワークに散在する未知楽曲を対象とした検索を実現するために 楽曲の与える印象を表すメタデータの抽出方式を提案する. 提案方式は 個々の楽器に対応する音符列から 印象を表す形容詞群 および それらと個々の音符列の相関量を動的に抽出し また 音符列毎の印象を合成することで 楽曲のメタデータとして動的に定義する. 本論文では 実現システムを用いて 提案方式の実現可能性 および 有効性を示すFor music data on the global area network, we propose an automatic extraction method of metadata that represent impression. The proposed method dynamically extracts adjectives and correlations according to each instrument of a datum, and it dynamically integrates the results of each instrument to generate the metadata of the datum. We clarify feasibility of the proposed method with an implemented system.
小野田 透 角谷 和俊
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.393-398, 2007-07-03

現在、Web に対するキーワードの検索結果である URL 集合を、様々な観点から分類しユーザに提示することで検索を支援する技術が多く提供されている。しかし、従来の分類手法では検索結果として提示される URL の「現在の内容」を解析するものがほとんどで、URL の過去の更新に注目して解析するものは少ない。また、過去のページの中にはユーザにとって有用な情報を含むものが数多く存在すると考えられ、これらを利用することでユーザに対し、より有用な検索結果を提示できると考えられる。本研究では、ユーザによって入力された複数の質問キーワードが、検索結果の URL においてどのような時間的関係で出現しているかを解析し、キーワード間の時間的な関係に基づいて URL の分類および補完を行う手法を提案する。質問キーワード間の時間的な関係の解析は、Web アーカイブに蓄積されている過去の Web ページ情報を用いることで行う。解析の結果、判定された質問キーワード間の時間関係によって URL の分類を行う。さらに、本研究では提示する Web ページに対し、その過去のページを抽出して現在のページと共に提示することで情報の補完を行う。本稿では、提案するこれらの Web 検索支援手法について述べる。Classification and clustering search engines analyzing of Web page's content and returning serch results by topic have been provided. However, most conventionally classification and clustering methods analyzed "current contents" of URL shown as search results. And there are few what kind of things which analyzed update of the past. We analyze what kind of relations the plural query keywords which a user input appears with in this study in terms of time in a Web page shown as search results. We suggest method classifying Web pages in based on time relations between query keywords. We perform analysis of time relations between quesry keywords by using past Web page information accumulated to a Web archive. Furthermore, We supplement information in this study for a Web page to show by We extract a page of the past, and showing it with a current page. In this paper, We explain these Web search support methods.
谷崎 正明 上浦 真樹 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1995, no.12, pp.1-8, 1995-01-26

近年、ハイパーテキストの分野では、文書情報だけでなく3次元CAIデータや・ビデオ動画像をも容易に扱うことのできるアプリケーションが望まれている。このなかで地図情報、CAD情報などを扱う場合、実世界において個々の実体が特定の空間を占め、かつ、有効な時間区間を持つと考えられる。本稿では、これらの情報を時空間上に存在するオブジェクト群としてとらえ、時間・空間属性を持つオブジェクトとオブジェクト間の関係を表すリンクからなる時空間型ハイパーメディアを提案する。そして、オブジェクト間の時間・抱間的な重なりの制約を表現する共存関係、またオブジェクトの空間的な包含関係に基づくリンク情報の継承に関して述べる。In this paper, we propose a temporal and spatial hypermedia model based on container-type objects in order to express real-world entities having some spatial time-stamp attributes. In the application domains such as geographic and CAD information systems, objects are often overlapped and thus some spatial coordinates at some point. An object model having spatial and temporal attributes, whose type holds the information about the 1) co-existent relationships between the container and its component objects, 2) co-existent relationships among the component objects, and 3) inheritance of links from the container to its component objects is proposed.
佐々木 祥 宮田 高道 稲積 泰宏 小林 亜樹 酒井 善則
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2006, no.78, pp.407-413, 2006-07-14

近年急速に普及しているsocial bookmark は,これまで利用者が個別に管理していたbookmarkをネットワーク上で他の利用者と共有するサービスである.これらのサービスでは多くの場合,利用者がbookmarkに対して「タグ」と呼ばれる自由記述のキーワードを付与することによって管理を行うFolksonomyと呼ばれる分類法を採用している.このようにして利用者が付与したタグ情報の集合は,多数の利用者によって成長を続けるメタデータであるとみなせるため,このタグ情報を利用することにより効率的なコンテンツの検索や推薦を行うことができると考えられる.しかしながら,利用者はあくまで自分自身の嗜好に基づいてタグ付けを行っているため,分類に使用したタグ名そのものは,必ずしも他の利用者とって適切なものであるとは限らない.そこで本研究では,タグの持つ本質的な情報を,タグ名ではなく,タグによるコンテンツの分類情報であると仮定し,分類間の類似度に基づいて利用者に対して望ましいコンテンツの推薦を行うシステムを提案する.The web-based bookmark management service called social bookmark has recently come to be widely used. In the social bookmark, a user can add one or more keywords called `tags' to their own bookmark for future use. The tag information gathering from a lot of users allows us to classify the web contents including database of social bookmark. This classification method is known as Folksonomy. Furthermore, we can qualify the tag information as the effective meta-data for search and recommendation use. However, a user hardly adds tags considering other user's convenience. Because of this behavior, a user will be not satisfied with the way to classify web contents by the name of tags. In this paper, we assume that the essential information of tags are not tag names, but classifications of web contents by tags. Based on this assumption, we have proposed the content recommendation system based on the similarities between the classifications.
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.67, pp.229-235, 2005-07-13

近年,デジタルカメラ付き携帯電話やノートPC が普及してきており,個人の所有するコンテンツが増加してきている.これらのコンテンツの中には他者にとって有用なコンテンツが含まれている.また,アドホックネットワークやインスタントメッセンジャーの様にユーザ同士がPeer-to-Peer に接続し,自律分散的に形成されるネットワークが生まれてきている.そこで我々はこの様な環境においてコンテンツを共有・検索する手法について提案する.従来型のP2P ネットワークにおける検索ではファイル名とのキーワードマッチングのみであった.提案手法では,あるコンテンツの文脈情報??コンテンツの置かれている状況??を抽出・提示する事により,ユーザがコンテンツを評価できるようにしたり,発見的に関連コンテンツを検索したり出来るようにする. Recently, a cellular phone with a digital camera and a PDA have been popular , and then contents stored in a local computer are increasing. Some of them are useful for others. At the same time, many autonomous distributed networks emerge, such as ad-hoc networks or instant messengers. They are composed of indivisual users. We propose a method to share and search contents in those networks. Traditional method to search on a P2P network is just matching search keywords with file or directory name and it is insufficient. We propose a search method for P2P contents based on context of contents. Here, the context of contents means the situation which relates to contents and help you understand it better. The context makes users possible to understand the outline of the contents and to discover related contents.