高須賀 清隆 丸山 一貴 寺田 実
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.115-120, 2007-07-02

近年、情報爆発に伴い、多量な情報の中から情報を取り出すシステムの研究が盛んに行われている。その中で Web ページ推薦の分野ではユーザのブックマークを利用したシステムが多く、ブックマークされないような Web ページを推薦できないという問題があった。そこで本研究では、ユーザたちの閲覧履歴そのものを利用することで全 Web ページを対象に推薦可能とするシステムを構築し、その評価を行う。Because the number of web pages becomes very huge, and still increasing, many people have difficulty to reach pages they want. Although social bookmarking and search engines are helpful, users still have to find pages by themselves. Our goal is to recommend web pages which are supposed to be interesting for a user, without any extra actions of users. We developed a recommendation system that works based on URLs and the users. Our system has four features: (1) collaborative filtering based on URL only, (2) similarity between users using TF-IDF, (3) use of the real activity in our university, (4) and automatic evaluation using word extraction.
三石 大 佐々木 淳 船生 豊
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2000, no.44, pp.53-60, 2000-05-25

動画像や音声など、その内容を表すインデックスを明示的に作成することが難しいマルチメディアデータベース等の検索のために、半自動かつ動的にインデックスを生成するための手法について提案する。本稿で提案する手法は、利用者のデータベースの利用が、その利用者の関心や興味によって偏りがあることを利用するものである。これは、予め内容毎にある程度分類されているデータベースへの個々の利用者のアクセス履歴をもとに、それぞれの分野に対する利用者の興味の方向を示すベクトル空間(ユーザモデル)を推測し、同時に、個々のデータがどのような利用者からアクセスされたかの履歴をもとに、このユーザモデルからそのデータの内容を示すインデックスとしてのベクトル空間(タイトルモデル)を推測するものである。これを繰り返すことにより、データベースの利用時に各データの内容の方向性を示す値を動的に更新し、適切なインデックス付けが可能となると同時に、そのデータが持つ潜在的な意味情報の抽出が可能となると予想され、従来のシステムでは利用者が気付かなかったデータを発見することが可能となる。本稿では、このモデルに基づく漸化式を定義するとともに、シミュレーションによりその有効性を示す。We propose a semi-automatic indexing algorithm with emotional keywords such as genre names for multi-media database(e.g. movie files, audio files) according to user's sensitivity by using user's access histories for database. At first, we simply categorize data, and create a vector space of each user's interest(user model) from the history of which categories the data, the user had accessed, belong to. Next, we create vector space of each data(title model) from the history of which users the data had been accessed from. By continuing the above method, we could create suitable indexes, which show emotional content of data. In this paper, we define the recurrence formula based on the proposed algorithm. We also show the effectiveness of the algorithm by simulation result.
金沢 輝一 高須 淳宏 安達 淳
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1998, no.57, pp.165-172, 1998-07-08

情報検索においては自然言語の意味曖昧性が大きな問題となっており,ベクトル空間モデル上で問合せ表現のベクトルを拡張するquery expansionなどの手法が存在する.しかし問合せ表現は情報量が小さいために,検索者の意図を汲み取って的確にベクトルを拡張することは難しい.著者らは文書関連性を用いて文書ベクトルを拡張することで検索性能を向上させる手法を提案する.提案手法では検索テーブル作成時に文書関連性に基づいて文書集合を作り,この集合を単位として補う要素を決定することで精度の向上を図る.評価実験として,学術論文に予め付与されているキーワードを情報源として文書間の関連性を抽出,この関連性を元にベクトルを補って,tf・idfモデルやquery expansionとの性能比較を行う.Ambiguity of meaning is a serious problem in information retrieval, and query expansion in the vector space model is one of the typical methods, which expands the query vectors to cope with this problem. However, queries tend to have less information for fitting query vectors to the latent semantics, which are difficult to express in a few query words given by users. We propose a document expansion method which expands the document vectors based on relevance of documents. The proposed method, in which document sets are prepared based on the relevance of documents at the time search table is constructed by adding words for each set, is expected to increase the query precision. In this paper, we evaluate our method through retrieval experiments in which the relevance of documents extracted from scientific papers, and the comparison with tf・idf and query expansion methods is described.
池内 淳 野末 道子 安形 輝 久野 高志 石田 栄美 上田 修一
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2003, no.51, pp.159-166, 2003-05-22

Webの拡大に伴い、情報検索における、Webページの有用性の識別は重要な問題となっている。本研究では、まず、150万のページ集合から抽出した1 000ページについて、被験者によって、7ポイント・スケールで有用性判定行うとともに、その有用性判定の規準について分析をおこなった。さらに、ページの被リンク数、及び、特徴語を用いたWebページの有用性判定システムを構築し、各々の結果の比較を行った。In information retrieval, the problem of identifying web page usefulness increases its importance with expansion of the Web. In this study, firstly, web page test set(1,000 pages) was extracted from 150 million Japanese pages. Three respondents judged web page usefulness by 7-point scale, and we examined their judging criteria. We developed two type of web page usefulness judging systems by using linked frequency and key-term frequency, and compared each result.
澤井 陽平 篠原 昌子 神崎 映光 原 隆浩 西尾 章治郎
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2006, no.77, pp.41-48, 2006-07-12

アドホックネットワークでは,データの複製を作成することでデータの利用性が向上するが,データ更新の発生により,複製間の一貫性が損なわれる可能性がある.そのため,クオーラムシステムを用いた複製間の一貫性管理が有効となる.これまでに筆者らは,少数の移動体でクオーラムを構成し,複製問の一貫性を管理する方式を提案した.本稿では,シミュレーション実験により,提案方式の性能を詳細に評価し,その有効性を検証する.Data replication is effective for improving data availability in ad hoc networks. In an environment where data updates occuur,replicas of a data item may be inconsistent. To solve this problem,quorum based consistency management is a promissing approach. In our previous work,we have proposed a consistency management method that constructs quorums with a small number of mobile hosts. In this paper,we present simulataion results to evaluate the performance of our proposed methods by simulation experiment.
森田 千晶 増永 良文
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.68, pp.453-460, 2005-07-14

近年,古い資料や写真のデジタル化などに伴い,モノクロ画像の自動着色技術の研究がすすめられている.そのひとつとして,色合いの参考となる画像(ソース画像)を用いてその色合いをモノクロ画像に転送することによってカラリゼーションを行う手法が提案されている.この手法はユーザの作業負担を軽減し自動的なカラリゼーションを実現させるが,そのために必要となる"ユーザの主観にあうソース画像"の用意が困難である.そこで本研究では,この手法を前提とし,"ユーザの主観にあうソース画像"を,画像検索技術を組み合わせることによってウェブ上から取得してくる方法を考案する.また,本稿ではこのシステムのための予備実験として,ウェブ画像検索の検索キーワードの選択方法に関する考察をおこなう.Recently, the research on automatic coloring technologies for grayscale images is extensively done due to the needs for digitalizing old materials and photographs. There is a technique for colorizing grayscale images by transferring color from a source color image to a grayscale image which is the destination. This technology seems to be attractive, but there is a problem of how to provide a source image that reflects user's subjectivity. In order to resolve this problem, we introduce a method of acquiring the source image along user's subjectivity from the Web by the image retrieval. A preliminary experiment is done in order to identify a set of keywords for effective retrieval of images from the Web.
渡辺 知恵美 増永 良文
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.193-199, 2002-07-18

我々は,データベース機能を完全に備え持つバーチャルリアリティ(VR)システムの実現を目指し,VRシステム群のバックエンドにデータベースサーバを連動させたシステム,仮想世界データベースシステム(Virtual World Database system :VWDB)の設計と実装を進めている.VWDBでは,仮想世界で行われる操作をトランザクションとして処理し,リアルタイムに仮想世界を管理する.このようなVWDBの機能は, 一つの仮想世界を複数ユーザでアクセスする仮想共同作業環境で最大限に活用することが出来る.そこで,本稿ではVWDB上に構築した共同作業環境について述べる.まず,VRクライアントによる仮想世界オブジェクトのアクセスをトランザクションとして管理するためのVWDBトランザクションを導入した.さらに,クライアントアプリケーションにゴーストオブジェクトという概念を導入することにより,一貫性及びリアルタイム性を持ったインタラクションを行うことが出来る.To provide a virtual work environment for cooperative work support, the VWDB is designed and implemented based on the network virtual reality system architecture. The VWDB is different from the traditional network virtual reality system in that it supports a full-scale database function, i.e. not only queries but also update requests are accepted. In order to realize the database function in the VWDB, the VWDB transactions are introduced. It is shown that the VWDB transactions are different from the traditional transactions in that the VWDB continuous transactions need to relax both the transaction model and the ACID property of transactions. Since the VWDB integrates a number of front-end virtual reality systems and a back-end database system via a high-speed network, a novel synchronization mechanism to make the state of the virtual world of the VWDB clients and the state of the back-end database system consistent is also investigated based on the transaction concept.
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2004, no.71, pp.199-205, 2004-07-13

近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバ・クライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.Recently, P2P network has been drawing attention. It is easier to share information on P2P network model than on server-client model. However, almost all researches study on improvement in the speed of retrieval. On the aspect of the information retrieval, matching file name with query is major, but it is very primitive and not enough to retrieve information efficiently. So, we find the problems of information retrieval on traditional P2P network, and we propose the system which provides more flexible information retrieval than one in the past.
郡 宏志 服部 峻 手塚太郎 田島 敬史 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2006, no.78, pp.35-42, 2006-07-13

近年,ユーザが Blog の中で自らの観光行動を日記として発信することが盛んになってきている.そのような Blogの中には,ユーザの観光時の行動経路が記述されていることも多い.そこで,我々は Blogからユーザの観光時の代表的な行動経路とその文脈を抽出し,それらを地図上にマッピングすることにより集約して提示するシステムを提案する.ユーザの行動経路の文脈は,その経路を経由したユーザの観光行動のテーマを表すキーワードという形で表される.また,ユーザの代表的な行動経路については,代表的なシーケンシャルパターンマイニングであるPrefixSpanを用いて抽出する.また,マイニングを行うために,各 Blogエントリから個々のBlogの書き手の行動経路を抽出する.その際に,我々は地名が指す場所におけるビジターの行動に着目することで各 Blogエントリからビジターの行動経路を抽出する.こうしてマイニングした代表的な経路に対して,システムはその経路の文脈であるキーワードを抽出する.このような,ビジターの経路及びそのコンテキストを提示するシステムは,ユーザの実空間における行動計画の立案を支援すると我々は考える.Recently, it is common that users release their sightseeing through internet by blog. Route that the user passed is often described in blog. Then, we propose a system that extracts visitors' typical geographical route and its context and shows on map collectively. Context of typical route is described by keywords which express the theme of the visitors. We extract typical route by representative sequential pattern mining method "PrefixSpan". Moreover, for mining the typical route, We extract each visitor's route for one blog entry.Then we focus on whether the visitor did some action at the place. Thus, for extracted typical route we extract the keyword which is the context of the route. This system supports user's plan to visit some place.
伊藤一成 酒井 康旭 斉藤 博昭
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2004, no.3, pp.41-48, 2004-01-15

本稿は自然言語処理を核とした新たな動画要約手法を提案する。動画内容はすべてメタデータを用いて表現できると仮定すると、音声と映像を分離して要約することが可能となる。すなわち、ユーザが指定する任意の要約率で音声テキストを要約した後に、対応する映像の重要区間を決定する。要約結果の提示の際には映像の重要区間を再生するのと同時に、日本語スピーチエンジンを利用して要約テキストを音声に変換することで、音声と映像の一貫性を考慮した要約生成が実現できる。ニュース報道番組の動画要約システムを試作し、提案手法の有効性を確認した。This paper proposes a novel movie summarization method based on meta data analysis and text processing. Since all the contents of a movie can be described in a meta data format, it becomes possible to summarize the movie in two layers: sound and video. Namely, the speech contents are firstly abridged at an arbitrary condense rate using natural language techniques. Then important video sections are determined corresponding to the selected speech parts. When the summarized result is presented, the video sections are reproduced along with the synthesized speech of the abridged text. This summarization method assures the consistency of sound and video. We have implemented a news summarization system and confirmed the effectiveness of our approach.
宇田 隆幸 藤井 敦 石川 徹也
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2004, no.3, pp.105-112, 2004-01-16

情報推薦システムは,ユーザの嗜好に関する情報を用いて新規情報に対する嗜好を予測し,嗜好に合うアイテムを提示する.協調フィルタリングに基づくシステムは,アイテムの内容解析をせず,他のユーザからの評価(アイテム-ユーザ評価マトリクス)を用いて推薦アイテムを決定する.対象ユーザと嗜好が似たユーザが好むアイテムは優先され,嗜好が異なるユーザが好むアイテムの優先度は下がる.ユーザがアイテムを選ぶたびに嗜好情報が更新されるため,検索キーワードの入力が必要ない.しかし,評価値疎ら問題や再生起問題により,未評価の(推薦対象にならない)アイテムが多く存在する.本研究は,ユーザの評価とアイテム間の類似度を併用して,推薦対象アイテム数を増やす「擬似投票方式」を提案する.新聞記事を対象にした評価実験の結果,本方式によって,推薦精度を落とすことなく推薦対象アイテム数を増やすことができた.Recommender systems utilize user profiles to predict his/her preference for unseen information items, and present preferable items. The collaborative filtering (CF) method does not analyze the content of items, but utilizes user rating (an item-user matrix) to determine recommending items. CF-based systems (do not) favor items rated highly by the users whose preference is (not) similar to that of a target user. Users can update their profiles by selecting items and do not need to submit search keywords. However, due to the sparsity and recurring startup problems, many items are not rated and thus cannot be recommended to users. To resolve these problems, we propose "pseudo-voting method", which increases the number of rated items by integrating user rating and content-based item similarity. We show the effectiveness of our method by means of experiments.
赤星 祐平 木俵 豊 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2004, no.71, pp.107-113, 2004-07-13

これまでの単一デバイスによる情報閲覧では,表示画面の制約やコンピュータ上のインタフェースの扱いによって,直観的な操作や閲覧が容易ではなかった.しかし,ユビキタスネットワーク環境下で,ネットワークに接続された複数のデバイスを用いることにより,これらの問題は解消され,多様なコンテンツをユーザの周りに出現させることが可能となる.しかし,ユーザの操作性やコンテンツの理解を容易にするためには,各デバイスの役割を明確化させ,協調的にコンテンツを表示させることが必要となる.本論文では,実空間上に存在する複数のデバイスを用いて,ユーザにより多くの適切な情報を提供することを目的としたコンテンツ閲覧方式を提案する.具体的には,各デバイスの役割を記述するための複合デバイス機能記述言語CDFML(Composite Device Function Mark-up Language)について提案するとともに,表示するコンテンツの内容解析と端末の位置やタイプなどの情報に基づいて,複数端末で適切にコンテンツを表示するための手法について提案する.When browsing contents in traditional style using single device,it is not easy for users to operate device intuitively and to browse contents because of device 's constraints on display capability and user interfaces.In ubiquitous environment,however,we can solve this problem by using multiple devices connected to network,and these ones are used to show variety of contents around users.In such situation,it is necessary to define the role of each device and show contents in a coordinated manner in order to improve users 'operationality and difficulty in understanding contents. In this paper,we propose a content browsing method to provide more proper information to users using multiple devices.In particular,we propose a composite device function mark-up language (CDFML)to describe each device 's role in browsing,and also describe a content browsing mechanism by content analysis and device information such as device position and device type.
中島 伸介 舘村純一 原 良憲 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.67, pp.31-38, 2005-07-13

近年,取得可能な情報量の増大に伴い,信頼できる情報を効率的に取得することが困難になっている.我々はWeb上での有識者を発見し,この有識者が発信するコンテンツに基づいた情報フィルタリングを行うことで,信頼できる情報の取得が可能ではないかと考え,重要なbloggerの発見手法の確立を目指した研究を行ってきた.しかしながら,blogスレッドの検出や,重要なbloggerの発見に関して,これまではTrackbackリンクを考慮できておらず,blogエントリ同士の関係を適切に抽出することが十分にできているとはいえない.したがって,Trackbackの利用状況の調査と,この結果に基づくTrackbackの利用方法に関する検討を行った.With rapid spread of amount of information, it become difficult for us to discover trusty information efficiently. Consequently, we try to extract blog threads and to discover important bloggers, because we consider that it is possible to provide trusty information by using information filtering based on important bloggers as learned people. Now, we have not used trackback data of blog entries, so that we could not extract blog threads and could not discover important bloggers. Thus, we investigate influence of trackback links on blog thread formation and use of trackback link for discovering important bloggers.
阿部 淳也 出石 大志 杉上裕一 堀 幸雄 今井 慈郎
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.6, pp.97-102, 2007-01-26

伝統的な木構造を用いたファイルシステムが広範に使用されているが,各ファイルのコンテンツによる分類や関係付けの有効な手法が不足している.そのような単純なファイルシステムでは,キーワードを指定した効果的なファイル検索ができないという問題を抱えている.コンテンツに基づく情報検索を可能にするため,各ファイルに関するタグ情報を活用するファイル管理の新しい手法を設計している.本報告では,我々が作成しているファイル管理システムのGUIを紹介し,併せて,形態素解析によるファイル属性からのキーワード抽出,DBMSによるキーワード操作およびキーワードに基づく情報検索などを用いた,プロトタイプ実装についても言及する.Conventional tree-structured file systems have been widely used, but they have lacked a useful mechanism to classify and relate their files according to the contents of each file. And such simple file systems are suffering from efficient retrieval of their files by specifying keywords. In order to perform content-based information retrieval, a new scheme of file management is designed to utilize tagged information about each file. In this report, we will introduce a GUI of our file management system. And we will describe its prototype implementation by means of keyword extraction from file attributes with morphological analysis, keyword manipulation through DBMS and information retrieval based on keywords.
遠藤 斉 片岡 良治
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1999, no.61, pp.273-278, 1999-07-21

本稿では、動画から抽出できるカメラモーションを特徴量として利用したスポーツ映像の内容検索手法を提案する。スポーツ映像にはシーン特有のカメラワークが存在することが多いため、一連のカメラワークを手がかりにシーンの内容に基づいた検索を行えることが期待できる。そこで本稿では検索キーとして指定した映像と検索対象の映像から特徴量としてカメラモーションを抽出し、連続DPマッチングを適用することによりカメラモーションの類似したシーンを検出する手法を提案する。実際の野球中継の映像を用いて適合率と再現率を評価した結果、その有効性が明らかになった。This paper proposes a method for content-based sports video retrieval using camera work information. Since particular camera work for a typical scene exists in sports video, a transition of camera work becomes an effective cue for retrieving a sports scene based on its content. Therefore, the proposing method extracts a series of camera parameters from both a user-specified scene of a retrieval key and a video stream of a retrieval target, and detects scenes having a similar content to the key from the target applying the continuous DP matching. It is evaluated using a video stream of a baseball game. Recall-Precision curves make its effectiveness clear.
佐保田 圭介 杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2003, no.71, pp.25-32, 2003-07-16

Web 検索エンジンによって得られる大量の検索結果の中から,個々の利用者が所望の情報を取得することは極めて困難であるため,有用な情報だけを取得する手法の提案が望まれている.そこで,本稿では協調フィルタリングとブックマークの構造を用いたフィルタリングを共に用いて,Web情報検索を支援するシステムを提案する.本研究では,ブックマークはそれを作成した人の Webページに対する有用な知識の集合であると考えているため,ブックマークされている Web ページだけではなくその構造も有用な知識であると考えている.したがって,閲覧している Web ページの持つキーワードを利用して,他の利用者がブックマークしている Web ページを推薦する協調フィルタリング機能を実現し,さらに協調フィルタリング機能によって推薦された Web ページを,ブックマークの構造を利用するフィルタリング機能を用いて厳選し,最終推薦Web ページとして提示するシステムの実現を目指す.It is expected to propose a technique to obtain only useful information for each user. Because,it is quite difficult for users to obtain their desired information among a large amount of search results returned by a Web search engine. Therefore, it is expected to propose a technique for obtaining only useful information for each user. In this paper, we propose an assistant system for user to help users to search Web pages using both collaborative filtering and filtering exploiting the structure of web bookmark. In our study, we regard each user's bookmark as a collection of useful knowledge, so that, we consider not only bookmarked Web pages but also its structure as useful knowledge. Based on these ideas, first we develop a collaborative filtering system that recommends Web pages bookmarked by other users using keywords included in a user's browsing Web page. And then our system carefully select the recommended Web page using filtering system based on the strucuture of bookmark and propose the selected Web pages as final recommended Web pages.
鬼塚真 磯部 成二
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1997, no.7, pp.33-40, 1997-01-21

設計業務や分析業務では手戻りが頻繁に起きやすいため,ある時点での一貫性のあるデータをデータベース管理システムが自動的に保持することが要求される.また業務処理の手順が決定している場合は,この手順をデータベースで管理することによってデータの一貫性を保障することも要求される.前者の要求を実現するため,本稿では共用データベース上に,オブジェクトの状態とオブジェクト間に関する静的制約を定義することによって,チェックイン・チェックアウトを自動化する方式を提案する.一方後者の要求を実現するため,事象の事前条件・事後条件をデータベース上に定義することによって,長期トランザクションを構成する短期トランザクションの実行順序を保障する方式を提案する.We present two mechanisms of long transaction for engineering database management systems, one is to automate check in and check out control and the other is to insure the execution order of short transactions that compose a long transaction. The former mechanism automates the control of transferring objects from group database to private database and vice versa by the static constraints of objects. The latter mechanism insures the short transactions execution order by the dynamic constraints which manage pre-condition and post-condition of each event in short transactions.