松本 明 森嶋 厚行 北川 博之
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.83-90, 2002-07-18

既存のXML問合せ言語や操作系では,ユーザはテキストエディタや視覚的操作系を用いて問合せを直接記述する.我々はこれらとは全く異なるアプローチのXML操作系であるXLearnerの研究開発を行っている.XLearnerは,サンプルのXML要素に対するユーザの例示操作からシステムがXQuery問合せを推論する.構造化データであるRDB等と異なり,例示操作に基づくXQuery問合せ推論は自明ではない.XLearnerはXQuery問合せに対するシステマティックな推論機構を提供する.XLearnerを用いた問合せ推論過程では,ユーザとシステムのインタラクションが必要となる.本稿では,本推論機構の概要,および,問合せ推論に必要なインタラクション数に関する実験結果について報告する.Existing XML query languages are textual or graphical languages in which we can specify queries for XML manipulation. This paper explains XLearner, a different kind of manipulation framework for XML. XLearner infers XQuery queries based on operations of sample XML elements. Inferring queries for XML is a non-trivial task, because XML is a kind of semistructured data, in contrast to relational databases whose data structure is completely regular. XLearner gives a systematic way to infer XQuery queries. The algorithm requires interactions between the system and the users. The paper reports an overview of its inference mechanism and experimental results on the number of required interactions.
高見 真也 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.283-288, 2007-07-03

ウェブ検索エンジンは、ウェブページを発見するためだけではなく、知識やサービスにアクセスするための道具としても使われるようになってきている。そのため、ユーザが入力した検索語に応じて、広告コンテンツやサービスへの誘導リンク等も検索結果に表示されるようになった。しかし、検索語だけでますます多様化するユーザの検索目的を把握することは難しく、検索語で表示内容、表示順序が一意に決定される検索結果では、求める情報までの経路が最適化されているとはいえない。我々はユーザの検索目的に適した検索結果を提供するために、検索結果として示すべき概要文(スニペット)を二種類の軸で分類した。そして、最適化された検索結果を実現するためのスニペットの動的再生成を紹介する。我々は、このように検索目的に適した検索結果表示を行うことを SPO (Search Purpose Optimization) と呼んでいる。Web search engines are used as a tool not only to find web pages but also to access some knowledge and services. Therefore, the links to advertising contents and services etc. came to be displayed in the search results according to the search query that the user had input. However, it is difficult for such systems to know user's search purpose because it is more and more diversified. The route to target information is not necessarily optimized in the search results when the search query defines both the ranking and the content in the search results. We classified the outline (Web-Snippet) in the search result by two criteria to offer a suitable search result for user's search purpose. Then we introduce dynamic re-generation of the Web-Snippet to achieve the optimization of search results. We call such display of search result suitable for the search purpose SPO (Search Purpose Optimization).
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2001, no.44, pp.137-144, 2001-05-21

大量の自由記述されたテキストデータからの知識発見を支援するテキストマイニングでは、テキストデータの分析結果を視覚的に提示することが重要となる。本論分では、我々が使用したテキストマイニングシステムに実装した、複数の概念関係の視覚化方式を組み合わせたトップダウンの知識発見アプローチを実現する概念関係視覚化方式について報告する。実際の自由記述型のアンケートデータを使用し、本概念関係視覚化方式の、注目すべき概念の発見や重要な概念関係への絞込みといった作業における有効性を確認した。また、概念関係抽出性能の検証を行なった結果、従来手法に比べて、高い精度で概念関係を抽出できることを確認したVisualization of relationship between concepts is important in text mining as the process of knowledge discovery from large amount of unstructured text data. In this paper, we proposed an unique visualization method of concept relationship in top-down knowledge discovery approach that is implemented in a system prototyped by authours. Text data analysis is performed to real Q&A data in free from, which is retrieved from information providing service in a commercial web site and we found that our visualization method helps analyst's work to select concepts to be focused and to organiza concepts relationship for reporting. Ecperimental results show that the prototyped system can extract concepts relationship with higher precision compared to conventional method.
大本 英徹 岸 三樹夫 中城 一 田中 大資 三谷 宗玄
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1999, no.61, pp.381-386, 1999-07-21

阪神・淡路大震災では,都市直下型地震の恐怖と同時に,災害時に対応した情報交換提供システムの欠如が露呈され,各種の救援活動に必要な情報の不足や錯綜が起こる事態となった.本論文では,ともすれば忘れられがちな震災時の経験に立ち戻り,災害情報システムとして何が必要であったのか,また足りなかったのかという問題点を論じる.また,我々は避難所における被災市民の日常生活を支援することを目標とする災害情報システムOnigiriを開発してきており,その設計において考慮した背景と設計目標,現在の実装に関する概略,及びシステムの今後の問題点などについて述べる.Hanshin-Awaji Great Earthquake mede us be aware of lack of fully equipped information systems against large scale urban disasters in our society, the information for the rescue activity was very shortage and confused. In this paper, we discuss what were incomplete and need in the information system for disasters. Based on these discussion, We have been developing Onigiri, an information sharing system for disasters to support daily life of sufferers. The outline of background, aim and current implementation of our Onigiriare also described.
田中 聡 大場 達生
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1998, no.57, pp.157-164, 1998-07-08

データウェアハウスについては、昨今、数々の議論がなされてきた。しかしながら、OLAP(OnLine Analytical Processing)という観点では、意外と少ないと感じている。これは、OLAPがデータウェアハウスでありながら、このなかでの位置づけが明確になっていないせいだと考える。本稿ではOLAPのデータウェアハウスでの位置づけを延べ、ここで必要とされる機能と、OLAPとして構築する集計データマートと検索用として構築する生データマートとの違い、およびそれらの連携とHybrid OLAPについて、ドリルスルーという技法を中心に述べる。Recently Data Warehousing has become a pop ular topic to be discussed by people from various fields. However, only a few people talk about a term OLAP (On-Line Analytical Processing), because OLAP has not been recognized as a part of Data Warehousing solutions among these people. In this paper I will define what is OLAP as a Data Warehousing solution and introduce the functions necessary for building OLAP and the difference between the Aggregate Data-mart built for OLAP and the Raw Data-mart built as referential data. Also, I will cover how these two types of Data-mart are related with each other and what is Hybrid OLAP as describing a OLAP method, i.e., Drill-Through
只石正輝 森嶋 厚行 田島 敬史
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2008, no.88, pp.229-234, 2008-09-14

今日, XMLや RDF 等のエッジラベル付き有向グラフが生成,蓄積されている.また,生成,蓄積されるグラフは大規模となってきており,グラフに対する効率的な管理/検索が重要な問題となってきている.本論文では,大規模なグラフに対する問合せの一つである子供/子孫問合せに着目し,それらの問合せを効率的に処理するためのノード格納方式を提案する.Today, we have many edge-labeled directed graphs such as ones written in RDF and XML. Because the size of such graphs is getting larger, efficient processing of queries against graphs is important. This paper proposes a novel node storing scheme for the efficient processing of child/descendant queries.
田代 崇 上田 高徳 堀 泰祐 平手 勇宇 山名 早人
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2006, no.78, pp.27-33, 2006-07-13

近年のWebページ総数の飛躍的な増加に伴い,歌詞や新聞記事の無断引用などの著作権侵害のWebページの数も増大している.そこで本稿では,著作権違反の疑いのあるページを自動検出するシステムを提案する.本システムではまず,検索ワードを,指定された文章を文節単位に区切り組み合わせることにより生成し、GoogleやYahoo!が提供しているWebサービスを用いて著作権違反の候補ページを収集する.次に候補ページを類似度をもとにランキングを行ない,ユーザーに提示する.ランキングに用いた類似度は文節をもとにした最長共通部分列から求める.評価実験を行った結果,歌詞,新聞記事,ブログ等からなるWebページをシードとして,著作権侵害ページを検出することができた.Due to explosive increase of the number of web pages, the number of copyright violation web pages, such as lyrics or news citation pages without permission, has also been increased. To solve this problem, we propose a system for detecting copyright violation web pages. The proposed system consists of three steps. Firstly, the system generates search keywords on phrasal units, called "bunsetsu", which are included in the "seed page." Secondly, on search keywords generated by the first step, the system gathers candidate of web pages violating copyright by using Google or Yahoo! web service. Finally, the system re-ranks the candidate web pages with similarity to the seed page. Here, we adopted "Longest Common Subsequence" of phrasal units, as a similarity measurement. Our evaluation confirmed that proposed system is able to extract copy violation web pages correctly.
北島 信哉 原 隆浩 寺田 努 義久 智樹 西尾 章治郎
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2008, no.88, pp.103-108, 2008-09-14

近年,サーバが PDA やスマートフォンなどのモバイル端末にデータベースの内容を周期的に放送する放送型データベースシステムが注目されている.放送型データベースシステムにおける問合せ処理手法としては,オンデマンド型方式,クライアント型方式,協調型方式の 3 方式が考えられる.これらの方式は電力消費に差があり,また,モバイル端末では利用できる電力に限りがある.そこで本稿では,モバイル端末を用いた実機評価により消費電力の特性を明らかにする.さらに,モバイル端末の電力残量を考慮し, 3 方式の中から動的に処理方式を選択する手法を提案する.In recent years, there has been an increasing interest in a broadcast database system where the server periodically broadcasts contents of a database to mobile clients such as PDAs and smartphones. There are three query processing methods in the broadcast database system. Generally, mobile clients have limits in power consumption, i.e., battery, and each of the three methods consumes different amount of power for query processing. In this paper, we reveal the characteristics of power consumption by conducting a preliminary experiment on the implemented prototype, then propose a new query processing method which dynamically chooses a query processing method among the three query processing methods considering energy consumption.
大津 浩二 松田 宜之 金森 吉成 増永 良文 脇山 俊一郎
vol.1994, no.86, pp.71-78, 1994-10-13

本論文は、画像データベースのアプリケーションを容易に開発できるオブジェクト指向のスクリプト言語の設計について述べる。この言語を用いて、ユーザは計算機環境から独立した高水準なシナリオを記述することができる。言語は、画像処理オブジェクト定義、シナリオ構造記述、データベース問合せオブジェクト定義、シナリオ起動メッセージなどの機能を持っている。このスクリプト言語の特色は、検索された画像オブジェクトに種々な画像処理を適用することが簡単に表現できることである。さらに、著者等が提案している画像データベースアーキテクチャ上でスクリプトがどのように解釈、実行されるかを例を使って説明した。This paper describes a design of object-oriented script language to ease application developments for image databases. User can make a high level scenario written in the script, which is independent of computing environments. The script has many functions: definition of image processing objects, description of scenario structure, definition of query objects, start message for scenario, and etc. There is a characteristic of the script: it is ease to write the scenario that users apply some kind of image processing functions to image objects retrieved from databases. Furthermore, we have explained how the script is interpreted and executed under an image database architecture which we have proposed.
藤井 敦 秋葉 友良
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.54, pp.21-28, 2007-05-31

Web を検索するユーザの情報要求は多種多様であり、検索質問の種類によって必要とされる検索手法が異なるという知見が得られている。本研究は、検索質問を「調査型(ある事項に関する一般的な調べ物が目的)」と「誘導型(ある事項に関するトップページを探すことが目的)」に自動分類し、その結果に基づいて検索手法を動的に変更する手法を提案する。誘導型の検索質問に使われる語句は、特定のページにリンクするためのアンカーテキストに現れやすい傾向がある。そこで、検索質問中の語句が Web 上のアンカーテキスト群にどのように分布しているかを解析し、検索質問を分類する。NTCIR の Web 検索用テストコレクションを用いた実験の結果、本手法の有効性が確認された。また、検索質問の分類を質問応答に応用する手法を提案し、その効果について議論する。There are a number of types of queries on the Web and the ideal retrieval method can vary depending on the query type. We propose a method to classify queries into the "informational" type for which the purpose is to find one or more pages related to a topic or the "navigational" type for which the purpose is to find the representative page of a topic, and use different retrieval methods depending on the query type. Because keywords in navigational queries often appear in anchor texts to link to another pages, we analyze the distribution of a target keyword in the anchor texts on the Web for query classification purposes. We use the NTCIR Web test collection and show the effectiveness of our method experimentally. We also apply our query classification method to question answering and discuss its effects.
浅賀 千里 Yusuf Mukarramah 渡辺 知恵美
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.387-392, 2007-07-03

オノマトペとはいわゆる擬態語・擬音語のことである。事象を的確に表現でき、コミュニケーションを図る上で重要なものである。ところが、オノマトペは感覚的なものであるので外国人の曰本語学習者がオノマトペの用例を習得するのは難しく、その学習に有効なのはオノマトペを含む文章を知ることだと言われている。そこで、我々は Web から数多くの新しい文章を抽出し、学習者に提示できるようなオノマトペ用例辞典の開発を進めている。本辞典では現在、オノマトペの品詞的役割によって用例を分類し画面上に提示しているが、それでは様々な用例が混在し、オノマトペの意味が理解しにくい。そこで、学習者がより理解を深められるよう、本稿ではオノマトペの用例をオノマトペの意味ごとに分類し提示する手法を検討している。また、オノマトペがどのような語に係るのか、その語にどのようなオノマトペが係るのかを知ることができるようその関係を可視化する。Onomatopoeia which is imitative word is exepress concrete phenomenon and it plays a crucial part in communication. But it is difficult for learners of Japanese who study Japanese onomatopoeia to understand their means and usages because onomatopia is sensuous. An effective method for mastering onomatopoeia is to read a lot of sentences with onomatopoeia. Then we are developing an online onomatopoeia example-based dictionary which collects a lot of sentences with onomatopoeia from the Web. Now we presents sentences which is classified in a part of speech role of onomatopoeia the screen. However each onomatopoeia has multiple meaning, in the current version, sentences which have different meaning of onomatopoeia are mixed in the example list. Then, we attempt classifying these examples of onomatopoeia by onomatopoeia meaning to presrent them to Japanese-language learners in more understandable way. Moreover, to study co-occurrence relationships between onomatopoeias and verb (or noun), we also attempt to visualize relationships of onomatopoeias and the other words.
増永 良文
vol.1993, no.65, pp.175-184, 1993-07-22

本研究では文部省検定済教科書(中学生の社会科・地理)を例にして,その電子化を行っている.教科書は学習指導要領に示される目標・内容・内容の取扱を基本に,国際化,重点化,情報化,学習効果等に留意して編集されている.情報化には記述に加えて図版が多用・活用され,学習効果を狙って内容がよく整理されている.しかし,紙による印刷物であることから来る限界があり,更に情報化や学習効果の向上を達成するには教科書の電子化で対処することが考えられる.本稿では,教科書をどう電子化するのが,電子化の意義,電子化のための教科書の構造分析,教科書の論理構造に加えて内容構造導入の必要性,試作したプロトタイプシステムの画面インタフェース,そして検索体系について報告する.Under the guidance of Ministry of Education, Culture and Science, text books are edited and written well so that high educational effect can be achieved. Educational topics are selected to adapt the current trends to internationalization or computerized society. Although many color and monochrome pictures and graphs are used to enhance understanding, there is a limitation in education and learning in the sense that text book are the traditional printing materials. To break through this limitation, we have developed a multimedia electronic text book in geography for junior high school, which is reported in this paper.
庭田 和典 新津 善弘
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.6, pp.137-141, 2007-01-26

SNSへの参加人数は年々増加傾向にあり,電子商取引を始めとした様々なサービスとの連携が期待されている.しかし,収益方式は未だ確立しておらず,業界最大手のmixiを始めとしてほとんどのSNSでは広告やアフィリエイトに頼っているのが現状である.SNSにおいてはユーザ同士の繋がりが最重視されているため,こういった金銭のやり取りをユーザに感じさせるサービスとは相性が悪い.本研究では,SNSと電子商取引の連携について着目し,既存の広告ビジネスを利用した方式やユーザ同士の繋がりを有効活用した方式を提案する.There is the participation number of people to social networking service in a tendency to increase year by year, and cooperation with the various service that assumed electronic commerce the beginning is expected. However, I do not yet establish a profit model, and it is the present conditions by most social networking service including mixi of the industry largest company that rely in an advertisement and an affiliate. I am uncongenial to service to let a user feel the exchanges of such money so that a connection between users is made much of in SNS most. In this study, I pay my attention about cooperation of social networking service and electronic commerce and suggest the method that utilized a method and a connection between users that used existing advertisement business effectively.
藤本 典幸 萩原 兼一
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.68, pp.659-664, 2005-07-15

個人ユーザを対象に,数Mbps程度のインターネット回線1本とコモディティPC1台のみを用いて,ウェブページ上に掲載されているマルチメディアデータをキーワード検索するシステムの設計と実装,および評価結果について述べる.サポートされるデータ形式は,画像(JPEG GIF PNG),動画(MPEG FLASH RealMediaなど) 音声(MP3 wave MIDIなど) PDFファイルなど,HTMLのIMGタグ,Aタグ,OBJECTタグ,EMBEDタグで記述できるもの全てである.本システムはユーザがクエリーと収集時間を入力した後に,Google Web APIを用いて取得したウェブページ群を種ページとして,指定された時間の間,トピック主導型クローリングを行い,収集したHTMLのテキストベースの解析を行う(マルチメディアデータの内容解析は行わない).クローリングアルゴリズム,スコアリングアルゴリズムを工夫し,マルチスレッドプログラミングを行うことにより,本システムは,各ウェブサイトにかかる負荷を考慮しつつ,ユーザのクエリー入力後 30秒間で150ページ前後のウェブページをクローリング,解析し,300個程度のマルティメディアデータ(多くは画像)をスコア順に出力することができる.This paper describes the design, implementation, and evaluation of a novel Web multimedia search engine software. The hardware resources required by our engine are only one commodity personal computer (PC for short) and only one Internet connection with a few Mbps. For a given query and a given time interval,our engine retrieves Web pages relevant to the query during the time interval. Then, our engine analyzes the collected Web pages and finally enumerates multimedia data in the Web pages in the descending order of score for the query. We evaluated our engine on 2.4GHz Intel Pentium 4 PC with 512MB RAM and 16.66Mbps effective bandwidth to the Internet. Our experiments show that,due to our sophisticated Web crawling algorithm, multimedia data discard algorithm, and multimedia data scoring algorithm, our engine can typically select 273 multimedia data of 395 multimedia data in 206 Web pages in 33.92 seconds.
伊藤敬彦 堀部 史郎 新保仁 松本 裕治
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2003, no.51, pp.181-188, 2003-05-22

ある文献が他のどの文献を参照しているか、という文献の参照情報は、その文献の参考文献一覧の各一文(参考文献文)が指し示している文献を、文献データベース(著者、題目、掲載誌等からなる文献を表す文献データ集合)中から同定することで獲得できる。この同定を、参考文献文と文献データの単なる文字列の完全一致判定で行なうことはできない。参考文献文に表記の多様性や誤りが存在するためである。本稿では参照情報の自動獲得手法を提案する。始めに、単一のベクトル空間とその上での類似度を用いて粗く候補を絞る。次に、参考文献と文候補が同一の文献であるかを多数の尺度に基づく類似度を特徴量として判定する。複数の尺度それぞれの重みを人手でつけることは現実的ではないため本稿ではサポートベクターマシーンを用い、各尺度の最適な重みを自動で算出した結果、F値0.992が得られた。Citation indices are invaluable for the retrieval of related papers. With the increase in the volume of scientific literature, a demand is growing for methods to automatically construct such indices. However, a naive method such as using exact string matches makes errors because of the various ways references can be formatted. In this paper, we propose a new citation indexing method that uses many features to evaluate similarity between references and bibligoraphic data. Unlike the previous work which typically uses only a few features to compute similarity, our method computes a weighted sum of more than 1200 feature values, each of which reflects one of the diverse similarity measures. An F-measure of 0.992 was obtained when Support Vector Machines were used to compute optimal weights to each feature.
平田 陽一 松倉 健志 田島 敬史 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2000, no.69, pp.137-144, 2000-07-26

従来のWeb検索における適合フィードバックでは,ユーザがサンプルページの内容を見て評価し,その評価をもとに再検索または検索結果の再構成を行なう.その際,ページの評価は「良い」または「悪い」の2種類であった.そのため,従来の適合フィードバックの手法は,「良い」と評価されたページに類似したページを獲得するのには有効だが,ユーザの要求が「この話題についてのより詳しいページが欲しい」などのように複雑になると,十分にユーザの意図を汲み取ることが難しく,うまく機能しないことがあった.そこで,本研究では,単に「良い」または「悪い」の二元論的な評価に基づいて,サンプルページに類似するページを集めるのではなくて,サンプルページと実際に欲しいページの違いを評価として与えることによって,そのような差異を持つページを探してくれるような,意味的な適合フィードバック機構を提案する.ページ間の差異としては,各ページ中の単語数や,お互いのページ内の単語の共起度を用いて,ページ間の情報量や話題の広がりの相対的な差を測定する.In conventional relevance feedback for Web query systems, the user evaluates some sample pages, and then based on that evaluation, the original query is revised, or the query results are reorganized. In that evaluation, sample pages are classified as good or bad. This approach is effective to find pages similar to the pages evaluated as good. In some cases, however, the users want to specify their requirements more specifically, such as, "I want pages discussing this topic in more detail." In the usual relevance feedback, the users cannot express such requirements in the evaluation. In this paper, we propose a framework where the users can express such requirements, which we call semantic relevance feedback. In our framework, the users specify the difference between a sample page and pages they want. We estimate the difference between pages based on the amount of information and the extent of the topic in each page. We measure the former by the number of word occurrences, and measure the latter by the ratio of cooccurrence of words in pages.
徐海燕 古川 哲也 史 一華
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2000, no.10, pp.53-60, 2000-01-24

ワークフローによって表される作業手順に関してデータベースが一貫するための統一的な判断基準が、協調型データベースで果たす役割について検討する。データ間の一貫性情報を利用できれば、処理単位やデータベースのための一貫性管理要求を形式的に定義できる。本論文では、作業手順によって表される一貫性基準に対して、一貫性管埋の問題を2つのデータ項目間の問題に帰着でき、実用的な方法で一貫性管理ができることを示す。マルチバージョンに対しても、同様な一貫性管理を行える。一方、協同作業を行う場合には、利用者は一貫する古いバージョンよりも最新バージョンを利用したい場合が多く、関連するデータに対する操作による影響も考慮すべきである。一貫性情報の利用はこのような協同作業の立場からの要求を支援するためにも役立つことを示す。In this paper, we discuss the effect on cooperative databases by consistency information such as workflows represented by graphs. Using the consistency information, both the consistency management requirements from transactions or database systems can be defined formally. The consistency information represented by graphs, furthermore, makes the consistency management efficiently. Even if multi-versions are recorded, the consistency information lets users utilize old versions explicitly. The consistency information is also useful to satisfy the both requirements of using the latest versions and avoiding rollback of a whole transaction.
喜多村 政贊
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.1998, no.57, pp.359-366, 1998-07-08

研究の背景は デジタルネットワーク社会で著作権の扱われ方が問題であること 解釈として 著作権処理技術の取り組み不足がある 解決法 人々の意志をより良く伝えるための技術的な枠組みを提供する権利者、利用者間の意志を翻訳し、契約と合意を支援する 効果 適性利用の促進、不正行為の抑止、そして新しい文化交流の社会 マルチメディアで話題となる著作権を、心の問題と考えれば、それぞれ相手を見て、権利者側は権利の所在や内容を積極的に表明し周知させる努力に欠け、利用者側は便利な機器を前にいつしか無断複製が習慣となってきたと見えます。しかし当事者の努力や工夫、倫理観とは別に、技術や商流の仕組みにも、個々の権利の尊重と対価の支払いへの姿勢が欠けていたことは否めない。デジタルネットワークの環境下では、今までのやり方では破綻が来るであろうとの声が大きく、コピ一禁止機能への要望が根強いが、別の面からは、デジタルネットワークによってはじめて権利者と利用者間の情報交換ができ、根本的な解決への道が見えてくる。つまり、正確な権利処理が可能となり、これにもとづいた需要と供給双方の合意による適正な利用がひろがり、無断や不正な利用が防止できるようにもなる。本論では、かかる視点から権利者にも利用者にもバランスのとれる技術の枠組みをつくる試みを紹介する。Copyright issue is introduced by rapidly advancing technology that has produced a many kind of copy functions such as photo copy, VCR and PC, but that has not yet made in general use of a copyright clearing system in synchronicity with such functions among consumers. This report shows a series of ideas of how to improve the market environment of the copyrighted contents delivery. Firstly copyright and contract information exchange is discussed as a mandatory requirement for the solution and the identifications and also the transfer method are defined. Secondly a translation function is introduced between content provider, service provider and content user. This will facilitate the trade of contents supporting the information exchange in semantic between contracting persons as an contract agent. Finally with use of an appropriate level of security, an improved environment of the trade is sketched out.
吉岡 由智 湯本 高行 田中 克己
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2005, no.68, pp.415-420, 2005-07-14

現在テレビやWebなどを通して膨大な数のニュース記事が配信されているが,配信されてきたニュース記事をそのまま閲覧,視聴するのではなく,一旦マルチメディアニュースアーカイブに保存しておき,そこでそれらの内容的な関係やそれを配信する者の視点の違いなどを抽出して示すことができれば,利用者はこの膨大な数のニュース記事をより有効に利用することができる.そこで本稿ではニュース記事の集合からニュース配信者の視点を抽出し,それらからトピック毎のニュースの全体像を構築する手法を提案する.トピックを伝える側の視点はトピックのテーマ,トピックの側面,トピックの側面を構成する要素からなっており,各ニュース記事から抽出される.トピックの全体像は視点を統合することによって構築する.全体像と視点を示すことによって利用者はトピックを多角的にとらえることができる.In present day, we can get enormous numbers of news articles on the Web and through TV. When news articles are stored in multimedia news archive, and the relationships of the articles and focused points of news distributors are extracted, user can use news data more effectively. In this study, we propose a way of extracting focused points of news distributors from news articles, and building an overall feature about each topic. The focused point consists of "a theme of topic", "the aspect of topic", and "the element of aspect". They are extracted from each news article. An overall feature is built by integrating focused points. By showing a overall feature and focused points about a topic, users can see the topic from various viewpoints.
関口 裕一郎 佐藤 吉秀 川島 晴美 奥田 英範
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2007, no.65, pp.207-210, 2007-07-03

ブログの急速な普及により、人々の生の体験や経験の情報がネットワーク上で多く発信されるようになり、それを用いたブログにおける話題の抽出等のマーケティング分析のニーズが増えてきている。しかしブログ記事は口語的な表現で記述されるため、分析時に商品名等の重要な固有表現が省略して表記されることによる分析精度の低下が問題となっている。本論文では、固有表現の正式表記の一部の文字を用いて作られる省略語を自動抽出することを目指し、ブログ文書での語句の使われ方を見ることにより省略語としての確からしさを算出手法を提案し、実際のブログ文書に適応した際の有効性について論じる。Many people write their experiments and impressions in their weblogs, and these articles have a much effect on buying behavior in web shopping. Thus, there are needs for mining topics in weblog articles for marketing purpose. In such mining processes, the proper noun is very important, though, many proper nouns are written in clipped word in weblogs. We describe a method to extract clipped words of the given proper noun using weblog articles that contains the original proper noun or candidates of clipped words. And evaluate the effectiveness using large weblog corpus.