著者
江田 毅晴 吉川 正俊 山室 雅司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.65, pp.405-410, 2007-07-03

本研究では、Folksonomy データの分析に基づく、新しい分類体系構築方法について提案する。現在のソーシャルブックマークサービスでは、大量のブックマークエントリの中から有用なリソースを探すには、キーワードやタグを指定するか、興味の近いブックマーカを努力して探し出す必要がある。本研究では、タグの共起関係に基づく意味的な繋がりを利用して、タグの集合を分類構造として体系だてる。これにより、利用者にはタグの関連を認識した直観的な探索を通して、有用なリソースを探しだすことが可能となる。In this research, we propose a new classification system based on the analysis folksonomy data. In order to find valuable resources from current social bookmark services, users need to specify search terms or tags, or to discover people with the similar interests. Our proposal utilizes semantic relationships extracted from the cooccurrences folksonomy data and organizes a new classification system from tag sets. Users can find useful resources by navigating tag relationships intuitively.
著者
小西 葉子 芝池 亮弥 鄭 舒元 曹 洋 吉川 正俊
出版者
情報ネットワーク法学会
雑誌
情報ネットワーク・ローレビュー (ISSN:24350303)
巻号頁・発行日
vol.22, pp.1-23, 2023-11-17 (Released:2023-11-17)

本稿は、法学の研究者と情報学の研究者が共同して、差分プライバシーを社会実装する際の法的課題を検討することを通じて、「高度化するデータ活用と個人情報保護の均衡を保つ」という社会的要請に応える研究の成果を示す。差分プライバシーとは、攻撃に対して返されるクエリ結果にノイズを付加することを要求し、プライバシー保護技術の安全性を定義する指標である。確率的意味を持つパラメーターによりプライバシー保護の程度が左右されることから、法的評価が困難な差分プライバシー技術であるが、本稿は差分プライバシーを用いたプライバシー保護の意義と限界に着目し、その法的な位置づけを明らかにする。研究手法としては、米国の国勢調査において実装された差分プライバシーをめぐる法的紛争の検討や、日本法との接続の観点から、高度な技術的手段に求められる透明性の水準・性質などの諸問題に迫る。
著者
杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.11, pp.975-990, 2004-11-01
被引用文献数
10

Web検索エンジンは,WWW(World Wide Web)上の情報を検索するための有用な手段である.しかし,同じ検索語が異なるユーザによって入力されたとしても,だれが検索語を入力したかにかかわらず,同じ結果を提示するという問題点を抱えている.一般に,各ユーザは自分の検索語に対して,異なる検索要求をもつと考えられる.したがって,その異なる検索要求をもつユーザに検索結果を適応させるべきであると考えられる.そこで本論文では,ユーザに負担をかけることなく各ユーザの検索要求に応じて検索結果を適応させる手法を提案し,その有効性について確かめる.実験の結果,修正した協調フィルタリングに基づいてユーザプロファイルを構築することによって,ユーザの嗜好に適応するきめの細かい検索システムを実現することができた.
著者
石井 裕志 馬 強 吉川 正俊
雑誌
全国大会講演論文集
巻号頁・発行日
vol.72, pp.239-240, 2010-03-08
参考文献数
2
被引用文献数
2
著者
鈴木 優 吉川 正俊
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.20-32, 2010-09-28

本研究では,Wikipedia において記事の信頼度を算出する際に,重要となる著者であるキーパーソンを簡易な方法で推定し,それら重要な著者の情報だけを利用して信頼度を算出することによって,すべての著者の情報を利用して信頼度を算出する方法よりも高速で精度の高い信頼度を算出する手法の提案を行う.これは,記事の大部分は少数の著者によって記述されているため,多くの著者の編集はその記事の信頼度には影響しないと考えることができ,それら多くの著者が行った編集を信頼度算出に用いないことにより,信頼度の算出にとって不要なノイズを除去することができると考えたためである.評価実験において信頼度が正しく算出できたかどうかを確かめた結果,確かに信頼度の精度が向上したことを確認することができた.さらに,提案手法を用いることにより,信頼度を計算するための計算コストを削減することも可能となった.
著者
石井 裕志 馬 強 吉川 正俊
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.10, pp.1-8, 2009-11-13
参考文献数
10
被引用文献数
2

人々のより深いニュース理解を支援するシステム作成のために,事象間の因果関係をネットワーク構造を用いて表現する手法を提案する.我々はこれまで,原因事象を始点ノード,結果事象を終点ノードとしたエッジラベル付き有向グラフとして因果関係ネットワークを表す TEC モデルを提案してきた.本稿では,日本語文法の SVO 構造に着目し,ノードの保持するキーワードのうち因果関係を含む文節から得られるキーワード (事象キーワード) について改良し,因果関係を含む文節から得る主語 (Subject),動詞 (Verb),目的語 (Object) の 3 属性を事象キーワードとする手法を提案する.因果関係ネットワークを構築するために類似した事象を表すノード対をマージするが,ノード間の事象キーワードを属性ごとに抽象概念レベルで比較することで,類似した事象のノード対を発見する.また,記事タイトルに含まれる語を利用してトピックの類似する記事集合間だけでマージ計算を行い,計算量を減らす手法を提案する.また,実際の記事から因果関係を抽出してマージを行い,トピックの類似する記事間集合だけでマージ計算を行っても精度や再現率が低下しないことを確かめた.In this paper, we propose a novel Topic-Event Causal relation model (TEC model) and describe a method to construct a Causal Network in a TEC model to support understanding of news. In the TEC model, causal relations are represented by an edge-labeled directed graph. A source vertex represents the cause of an event, and a destination vertex represents the result of that event. In the model, each vertex includes two types of keywords: topic keywords, which describe topics, and event keywords, which describe events. Using the SVO structure of Japanese, we compose event keywords as three words(Subject, Verb, Object). If each concept of event keywords is equal between two vertcies, we merge the verticies, which represent the similar event. In the merging calculation, Using topic keyword decrease computational complexity. A preliminary experiment of vertices merging to assess the validity of the proposed method demonstrated its usefulness.
著者
鈴木 優 吉川 正俊
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.20-32, 2010-09-28

本研究では,Wikipedia において記事の信頼度を算出する際に,重要となる著者であるキーパーソンを簡易な方法で推定し,それら重要な著者の情報だけを利用して信頼度を算出することによって,すべての著者の情報を利用して信頼度を算出する方法よりも高速で精度の高い信頼度を算出する手法の提案を行う.これは,記事の大部分は少数の著者によって記述されているため,多くの著者の編集はその記事の信頼度には影響しないと考えることができ,それら多くの著者が行った編集を信頼度算出に用いないことにより,信頼度の算出にとって不要なノイズを除去することができると考えたためである.評価実験において信頼度が正しく算出できたかどうかを確かめた結果,確かに信頼度の精度が向上したことを確認することができた.さらに,提案手法を用いることにより,信頼度を計算するための計算コストを削減することも可能となった.We propose a fast credibility assessment system of Wikipedia articles by identifying major contributors to reduce the calculation costs in determining the degree of credibility of Wikipedia articles. In our proposed system, similar to existing credibility degree measuring systems, the first calculates each editor's credibility values using the lifetime of versions, which is a number of versions includes the edits. Next, our system calculates the credibility values of articles by combining those of the article's editors. In this process, when the system identifies a small number of major contributors who have large effects to credibility degrees of articles, we can reduce calculation costs. Therefore, we propose three methods for identifying major contributors, such as number of versions based method, number of distinct document based method, and combined method of number of versions based method and number of distinct document based method. In our experimental evaluation, we unveil that our proposed system can reduce the calculation costs and increase the accuracy of credibility values of articles.
著者
清水 敏之 寺田 憲正 吉川 正俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.224-234, 2007-06-15
被引用文献数
2

利用者が文書に対して検索を行う際に,検索要求が検索結果文書中のどの部分と関連しているのかが分かることは有用である.たとえば,大量の学術論文の中から,ある話題に関連する章や節などの部分文書のみを拾い読みしたいという要求は高いと考えられる.近年,様々な文書がXMLで構造化されている.XML文書の構造を利用することで部分文書も対象とする検索が可能となる.そのため,XML文書に対する情報検索に関する研究がさかんになってきた.そこで我々はXML文書に対してキーワード集合による検索を行うシステムであるKikori-KSを開発した.キーワード検索は,XML文書のスキーマを知っている必要がなく,XML専用の問合せ言語に対する知識も必要ないため,多くの一般的な利用者が利用可能である.検索結果として入れ子するXML部分文書を単位として用いるため,我々は検索結果提示インタフェースが重要であると考え,今回開発したKikori-KSでは,XML文書検索のための検索結果表示インタフェースを用意した.キーワード検索に必要な情報は関係データベースに格納し,利用者が入力したキーワード集合に対して関連するXML部分文書を取得し,インタフェースを通じて利用者に提示する.我々は大量のXML部分文書を効率的に扱うために,実体化結合ビューを生成して検索の高速化を実現した.広く利用されている関係データベースを用いることで汎用性の高いシステムが構築できる.INEXテストコレクションを利用した実験では,Kikori-KSが実用的な検索速度と比較的高い適合性を持つことを確認した.Identifying meaningful document fragments is a major advantage achieved by encoding documents in XML. In scholarly articles, such document fragments include sections, subsections and paragraphs. XML information retrieval systems need to search document fragments relevant to queries from a set of XML documents. We present Kikori-KS, an effective and efficient XML information retrieval system for XML documents. Kikori-KS accepts a set of keywords as a query. This form of query is simple yet useful because users are not required to understand XML query languages or XML schema. To meet practical demands for searching relevant fragments in XML documents, we have developed a user-friendly interface for displaying search results. Kikori-KS was implemented on top of a relational XML database system developed by our group. By carefully designing the database schema, Kikori-KS handles a huge number of document fragments efficiently. Our experiments using INEX test collection show that Kikori-KS achieved an acceptable search time and with relatively high precision.
著者
植村 俊亮 波多野 賢治 天笠 俊之 吉川 正俊 渡邉 正裕 前田 亮 石川 正敏
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(B)
巻号頁・発行日
1999

インターネット時代を迎えて,地球規模の情報資源が現出しつつあると言われる.WWW(World Wide Web)は,その典型的な例である.しかし,WWWは,ばらばらに構築された,言語も文化も異なるホームページが互いに接続されて,利用可能になっているだけであって,そこから真に必要な知識を発掘する方式はまだ確立されていない.本研究では,WWWに代表される知識資源の大海から,必要な知識を発掘する方式を,とくにその多言語処理面から追求する.具体的には,次の多言語機能をもつ知識発掘システムの実現を目指す.1.ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出すことを可能にする.2.複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる、例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも母国語を使って問い合わせ,知識を発掘することを可能にする.多言語知識発掘システムのため本研究では以下の項目について研究を実践した.1)対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法,2)フォント埋め込み型HTML/XML文書による多言語文書のブラウジングシステムの実現,3)大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発.
著者
川本 淳平 吉川 正俊
出版者
情報処理学会
雑誌
情報処理学会論文誌トランザクション. データベース(TOD)
巻号頁・発行日
vol.4, no.3, pp.33-44, 2011-10-03

本論文では,キー・バリュー型データベースを対象に,利用者のプライバシを考慮した範囲問合せ手法を提案する.従来議論されてきたプライバシを考慮した情報検索 (PIR; private information retrieval) の枠組みでは,単独では範囲問合せが行えず,また検索用キー属性の値に重複が認められないという制限がある.提案手法では,キー属性の値と問合せそれぞれに摂動を加え暗号化を施すことで,これらの制限を設けることなく問合せへの頻度分析攻撃を防ぐ範囲問合せを実現する. In this paper, we introduce a new private range query method in key-value type database.Existing PIR (Private Information Retrieval) approaches have two limitations: it supports only equal queries but range queries;the key attribute used to query processing must be unique.Our approach, on the other hands, guarantees private range queries and allows tuples having a same value of the key attribute against frequency analysis attacks.For these properties, we add perturbations to both key attributes and queries, and encrypt them.
著者
岩井原 瑞穂 吉川 正俊 馬 強 浅野 泰仁
出版者
早稲田大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

本研究はソーシャルネットワークサービス(SNS)やWikiに代表されるソーシャルコンテンツから有用な情報を抽出する技術の開発を目的としている.wiki型コンテンツは多人数が1 つの記事を更新することにより,バージョンが蓄積されるが,その派生過程を正確に求める手法を開発した.またSNSにおいて利用者が行うプライバシー設定の傾向を分析し,適切な設定を推薦する手法を開発した.さらにコンテンツのアクセス制御について効率的な手法の開発を行った.
著者
本村 徹太郎 清水 敏之 吉川 正俊
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.29, pp.1-8, 2010-11-05

近年,多くの XML データが蓄積されるにつれ,XML キーワード検索が重要になっている.有用な結果を得るためには,効果的な検索結果を効率的に求めることだけでなく,検索結果を理解できるような情報を付加することが望ましい.我々は,検索結果の理解支援のために,検索結果と同じ結果を返す代替問合せを取得する方法を提案する.代替問合せは検索結果の異なる側面を表しているため,利用者は検索結果の隠れた関係を推測することで検索結果を深く理解する,あるいは利用者自身の問合せを洗練することなどが可能となる.
著者
押野 泰平 浅野 泰仁 吉川 正俊
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.27, pp.1-8, 2010-11-05

Web の構造的特徴に基づくグラフパターンは,web 解析や情報検索に重要な役割を果たしている.我々は web の構造情報だけでなく時間情報をも用いた新たなグラフパターンとして,時間グラフパターンというものを提案し研究を行ってきた.これまでの研究では,頻出グラフパターンを列挙することによってサンプルグラフ集合から時間グラフパターンをマイニングする手法を提案した.本稿ではマイニングされたパターンを用いた web 解析として,web サイトを話題の盛り上がり時における三つの役割として一次情報源,盛り上げ役,まとめ役に分類することを試みる.新たなグラフマイニング手法を用いることで,これまで達成できなかった三つの分類が可能になったことを示す.
著者
吉川 正俊 馬 強 浅野 泰仁 清水 敏之 岩井原 瑞穂 鈴木 優
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2008

Webサーバにおいて高品質な情報を管理するために,情報の注釈データの管理手法を開発すると共に,構造化文書の照応解析技術を開発した.知識資源を表現するRDFデータの格納及び検索システムを構築すると共に,検索エンジンと利用者生成型知識資源Wikipediaの統合利用システムを開発した.また,複数ニュースソースデータの統合利用手法として整合性提示機能提供システムおよび因果関係ネットワーク漸増構築法を開発した.
著者
江田 毅晴 吉川 正俊 山室 雅司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.107, no.131, pp.405-410, 2007-06-25

本研究では,Folksonomyデータの分析に基づく,新しい分類体系構築方法について提案する.現在のソーシャルブックマークサービスでは,大量のブックマークエントリの中から有用なリソースを探すには,キーワードやタグを指定するか,興味の近いブックマーカを努力して探し出す必要がある.本研究では,タグの共起関係に基づく意味的な繋がりを利用して,タグの集合を分類構造として体系だてる.これにより,利用者にはタグの関連を認識した直観的な探索を通して,有用なリソースを探しだすことが可能となる.
著者
鈴木 優 波多野 賢治 吉川 正俊 植村 俊亮 川越 恭二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.177, pp.195-200, 2004-07-07

現在,多くの検索システムを組み合わせることによって,検索システムの精度を向上させる方法が注目されている.このような検索システムでは,統合関数と呼ばれる,複数のスコアを統合するための関数を変更することによって,精度が向上することが知られている.ところが,最適な統合関数は利用者の問合せによって異なると考えられるため,あらかじめ一意に統合関数を定めることができない.ここで我々は,統合後のスコアの分布から,最適な統合関数を推定することができるのではないかと考えた.そこで本稿では,最適な統合関数を問合せごとに推定する方法として,シャノンの情報量の概念を援用した尺度を用いて,スコアの分布から統合関数の適合度を測定する方法の提案を行う.本提案では,利用者にとって必要な検索対象の数が検索対象全体の数と比較してきわめて少なく,検索結果に含まれる高いスコアの数が少ないとき,その検索結果は十分に正解集合を絞り込んでいると考えることができるため,利用者の検索目的に適した統合関数であると仮定した.評価実験を行うことによって,実際に適した統合関数を選択することができることを示した.
著者
佐保田 圭介 杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.25-32, 2003-07-16

Web 検索エンジンによって得られる大量の検索結果の中から,個々の利用者が所望の情報を取得することは極めて困難であるため,有用な情報だけを取得する手法の提案が望まれている.そこで,本稿では協調フィルタリングとブックマークの構造を用いたフィルタリングを共に用いて,Web情報検索を支援するシステムを提案する.本研究では,ブックマークはそれを作成した人の Webページに対する有用な知識の集合であると考えているため,ブックマークされている Web ページだけではなくその構造も有用な知識であると考えている.したがって,閲覧している Web ページの持つキーワードを利用して,他の利用者がブックマークしている Web ページを推薦する協調フィルタリング機能を実現し,さらに協調フィルタリング機能によって推薦された Web ページを,ブックマークの構造を利用するフィルタリング機能を用いて厳選し,最終推薦Web ページとして提示するシステムの実現を目指す.It is expected to propose a technique to obtain only useful information for each user. Because,it is quite difficult for users to obtain their desired information among a large amount of search results returned by a Web search engine. Therefore, it is expected to propose a technique for obtaining only useful information for each user. In this paper, we propose an assistant system for user to help users to search Web pages using both collaborative filtering and filtering exploiting the structure of web bookmark. In our study, we regard each user's bookmark as a collection of useful knowledge, so that, we consider not only bookmarked Web pages but also its structure as useful knowledge. Based on these ideas, first we develop a collaborative filtering system that recommends Web pages bookmarked by other users using keywords included in a user's browsing Web page. And then our system carefully select the recommended Web page using filtering system based on the strucuture of bookmark and propose the selected Web pages as final recommended Web pages.