著者
ウメルジアンウスマン 中平勝子 鈴木俊哉 植村俊亮 三上喜貴
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2013-DD-90, no.5, pp.1-8, 2013-07-19

本論文で扱うウイグル文字は,歴史的にはアラム文字を起源とし,アラム文字から派生したソグド文字を直接の祖先として形成された表音文字である.また,ウイグル文字からは,後にモンゴル文字,満州文字などが派生した.ウイグル文字は,縦書き,横書きいずれの書記方向でも書かれてきた.横書きのウイグル文字は中央アジアの西トルキスタンと東トルキスタン地方に見られる.一方,縦書きのウイグル文字は紀元 8-9 世紀頃にトルファン地方で誕生したと考えられ,西はトルファンから東はモンゴルと甘粛に至る広範囲で使われるようになった.検討にあたって,文献作品クダトクビリグと阿毘達磨倶舎論実義疏には,作成者の署名を表すような様々な図形が登場し,これをすべて符号化しようとすれば数百になる.ここで検討が必要なのは,縦書き用の文字と横書き用の文字を,符号として区別するかどうかという点である.ウイグル文字の単語中での文字の位置によって文字図形が変化する文字の場合,異なる図形ごとに異なる符号を与える方式,図形は異なっても同じ音を意味する場合には同じ符号を与える方式 (符号-グリフ分離方式) とがある.ISO/IEC 10646 では符号-グリフ分離方式が採用されていることから,本設計でも,符号-グリフ分離方式を採用した.筆者らは,このウイグル文字の文字符号を確立することによって,ウイグルの貴重な歴史的文献情報の保存と活用の基盤形成に貢献したいという目的をもって研究を行なっている.本論文ではその研究成果であるウイグル文字古文献に基づくグリフデザインの経験について述べる.
著者
奥 健太 中島 伸介 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.162-176, 2007-06-15
参考文献数
24
被引用文献数
12

本論文では,ユーザの状況に応じて適切な情報を提供する状況依存型情報推薦システムのプロトタイプを提案する.膨大な情報からユーザの嗜好に合致する情報を提供する手法として,情報推薦システムに関する研究が行われているが,ユーザのそのときの状況(時間帯や天気,同伴者,予算など)に応じて変化するユーザの嗜好に対し,柔軟に対応することは容易ではない.そこで我々は,状況に応じて変化するユーザの嗜好を適切にモデル化する手法を提案した.本論文では,このモデル化手法を適用した状況依存型情報推薦システムのプロトタイプを提案し,検証実験に基づいて,提案手法の評価を行った.この中で,提案手法であるコンテクスト依存型情報フィルタリングとコンテクスト依存型協調フィルタリングの有効性や特長の違いを明らかにするとともに,対象コンテンツの特徴パラメータの最適化に関して考察した.This paper proposes a prototype of a context-aware recommendation system which provides users with contents appropriate to their contexts. There have been many studies of recommendation systems which provide users with contents suited to their preferences. However, it is not easy to adapt these recommendations to changing contexts (e.g., time of day, weather, companions and budget). Thus, we propose a method which takes into account users' preferences as well as their current context. This paper also introduces a prototype of a context-aware recommendation system using the method, and evaluates our proposed methods. In our experiments, we explore the strengths and weaknesses both Context-Aware Information Filtering and Context-Aware Collaborative Filtering. Lastly, we discuss optimization of the feature parameters of contents.
著者
三宅 立記 今城 哲二 佐藤 忍 井藤 敏之 横塚 大典 辻畑 好秀 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.41, no.2, pp.89-101, 2000-03-15

既存の企業情報システムを安価に再構築するインフラとして Web を利用するイントラネットの導入が急速に進行している.しかし,企業情報システムのイントラネット化には,システム開発の面で次のような問題がある.()システム開発を行うための技術としてHTML,Java等をシステム開発者が新たに習得する必要がある.()COBOL,PL/I等の正確な精度を保証する10進演算機構が利用できないため,金額処理を伴ったシステム開発が困難.()従来のクライアントサーバシステムや端末に比べてレスポンスが悪い.COBOLスクリプトは,これらの問題を解決するために日立製作所と日立ソフトウェアエンジニアリングが共同開発したスクリプト言語であり,次のような特長を有する.()企業内の情報システム部門で最もよく利用されているCOBOL85をベースにWebに必要な機能に絞り込んだ言語仕様.()メインフレーム系のCOBOLと同一精度の10進演算機能をサポート.()既存のCOBOL処理系の長所,短所の分析に基づいた効率のよい実装.これにより次の成果を得た.()金額計算など誤差の許されない分野の業務を Web上で心配なく稼動可能とした.()テストデバッガやカバレージのサポートにより大規模な開発プロジェクトでの利用を可能にした.()プログラムの保守性を向上する日本語プログラミング機能をサポートした.()優れた実行性能を実現できた.The introduction of intranet which allows to access Web technology is rapidly growing as the infrastructure to restructure existing business information systems within a reasonable cost. However, in terms of system development, use of intranet on the business systems poses the following problems. (1)The system developers must learn new technology such as HTML and Java as the technology for system development. (2)As the decimal arithmetic functions, which guarantee the precision such as in COBOL and PL/I, are not available, it is difficult to develop systems that involves accounting processing. (3)The response time might exceed those of the existing Client and Server systems or terminals. COBOL Script, which is a script language developed jointly by Hitachi Ltd. and Hitachi Software Engineering Co., Ltd. to solve these problems, has the following features. (1)The language specification, which consists of required functions for Web computing, is a subset of COBOL85, which is the most frequently used programming language in business information analysis of the pros and the cons of the COBOL processing system. We obtain the following results; (1)Applications requiring high precision such as accounting processing can be operated on Web. (2)The test debugger and the coverage functions make it possible to use in a large development project. (3)The Japanese programming facility provides good maintainability. (4)Good performance is achieved.
著者
今城哲司 鈴木 弘 大野 治 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.41, no.4, pp.90-90, 2000-06-15

約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際規格化されていて,いくつかの言語では,識別名にも漢字などマルチオクラット文字が使用できる.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで,実用化されている.本論文では,分かち書きをしない,より日本語に近い日本語プログラム言語"まほろば"の設計思想と文法について述べ,実装実験による評価について報告する.Twenty years ago, programming languages have acquired an ability to handle Japanese. Generalizing it to internationalization (i18n), many of i18n facilities of each programing language were accepted as ISO standards. Some programming languages allow users to use user-defined words in such multi-octet characters as kanji. Some new Japanesebased programming languages have also been developed and used. In all those languages, keywords and grammar are based on Japanese, but words have to be separated by spaces. This paper discusses a non-separated (No wakachigaki) version ofJapanese-based programming langage"Mahoroba"."Mahoroba" is a word of ancient Japan, and means a nice country. The paper describes its design philosophy, syntax and evaluation by experimental implementation.
著者
今城 哲二 大野 治 植村 俊亮
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.41, no.SIG02(PRO6), pp.106-106, 2000-03-15

約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際化と一般化されて,国際規格化された.いくつかの言語では,識別名にも漢字などマルチオクテット文字が使用できる.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで,実用化されている.本発表では,より日本語に近い非分かち書きの日本語プログラム言語「まほろば」を提案し,その構文の設計の考え方を中心に論じる.
著者
木村 文則 前田 亮 波多野 賢治 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.49, no.7, pp.59-71, 2008-03-15
参考文献数
18
被引用文献数
1

本論文では,Web 文書の言語横断情報検索において,Web ディレクトリの階層構造を利用して問合せの検索対象分野の推定に基づいた検索手法を提案する.提案手法では,Yahoo! カテゴリのような複数の言語版を持つWeb ディレクトリを問合せ翻訳における訳語の曖昧性解消のための言語資源として利用し,Web ディレクトリの下層のカテゴリを上位のカテゴリに統合したうえで,利用者が入力した問合せ語群から検索対象分野の範囲を推定することで,問合せ語群の最適な訳語に翻訳することにより,言語横断情報検索を行う.評価実験では,Web 文書の言語横断情報検索に適切なカテゴリ統合度がどの程度であるのか検証し,提案した検索対象分野の推定の有効性を検証した.In this paper, we propose a cross-language information retrieval (CLIR) method based on an estimate of query domain related with search results using hierarchic structures of Web directories. To get the most appropriate translation of the queries, we utilize the Web directories written in many different languages as multilingual corpus for disambiguating translation of the query and estimate a domain of search results using hierarchical structures of Web directories. Experimental evaluations showed that we could have an advantage in retrieval accuracy using our proposal for disambiguating translation in CLIR system.
著者
堀内 優希 友田 政明 植村 俊亮
雑誌
全国大会講演論文集
巻号頁・発行日
vol.49, pp.233-234, 1994-09-20
被引用文献数
1

映像情報には、それに付随する開始時間、終了時間などの2次的な情報がある。この情報を場面単位でデータベースに格納すれば、利用者が条件を指定することにより、特定の場面を表す部分映像を得ることができる。本稿では、映像情報を場面単位で検索するためのデータ構造について述べ、野球中継の映像情報を例として、ホームラン、三振などの特定の場面を検索できるデータ構造を示す。
著者
花川 賢治 天笠 俊之 波多野 賢治 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2005, no.35, pp.81-88, 2005-03-25

本発表では、事実の集合を格納するデータベースからユーザの要求に応じた構造化文書を生成する処理について論じる。代表的な事実についての表現形式として、データベースと構造化文書が存在する。両者は対照的な性質を持ち、前者が意味的に独立した要素の集合であり、唯一の存在であるのに対し、後者は要素間の関係が木構造化され、その構造は利用者の参照の条件に応じて多数の種類が存在し得る。多数の種類の構造化文書を効率的に処理するためには、宣言的に構造化文書の仕様を記述するための言語と、データベースから構造化文書への変換を行う汎用の処理系が重要になる。本発表では、構造化文書の仕様記述言語に一階述語論理式を用い、Prologを拡張した処理系を実装する。We discuss a process of producing structured documents from a databases which contains facts.The usual methods of representing facts are a database and a structured document.They are very different.A database consists of independent elements and uniquely exists.In contrast, structured documents have tree structures where connections between elements have meanings and types of them are very diverse. In order to treat the diverse structured documents effectively, we propose a deductive language for specifying a tree structure and a general language processor for translating from a database to a structured document. In this language, the tree structure is specified in a first order predicate logic formula, and the language processor is implemented by extending a Prolog interpreter.
著者
杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.11, pp.975-990, 2004-11-01
被引用文献数
10

Web検索エンジンは,WWW(World Wide Web)上の情報を検索するための有用な手段である.しかし,同じ検索語が異なるユーザによって入力されたとしても,だれが検索語を入力したかにかかわらず,同じ結果を提示するという問題点を抱えている.一般に,各ユーザは自分の検索語に対して,異なる検索要求をもつと考えられる.したがって,その異なる検索要求をもつユーザに検索結果を適応させるべきであると考えられる.そこで本論文では,ユーザに負担をかけることなく各ユーザの検索要求に応じて検索結果を適応させる手法を提案し,その有効性について確かめる.実験の結果,修正した協調フィルタリングに基づいてユーザプロファイルを構築することによって,ユーザの嗜好に適応するきめの細かい検索システムを実現することができた.
著者
今城 哲二 鈴木 弘 大野 治 植村 俊亮
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.42, no.SIG02(PRO9), pp.102, 2001-02-15

約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際規格化されていて,いくつかの言語では,識別名にも漢字などマルチオクテット文字が使用できる.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで,実用化されている.本発表では,分かち書きをしない,より日本語に近い日本語プログラム言語``まほろば''の設計思想と文法について述べ,プログラマおよび学生による記述実験による評価について報告する.
著者
今城哲司 鈴木 弘 大野 治 植村 俊亮
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.41, no.SIG04(PRO7), pp.90, 2000-06-15

約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際規格化されていて,いくつかの言語では,識別名にも漢字などマルチオクラット文字が使用できる.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで,実用化されている.本論文では,分かち書きをしない,より日本語に近い日本語プログラム言語“まほろば”の設計思想と文法について述べ,実装実験による評価について報告する.
著者
今城 哲二 大野 治 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.41, no.2, pp.106-106, 2000-03-15

約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際化と一般化されて,国際規格化された.いくつかの言語では,識別名にも漢字などマルチオクテット文字が使用できる.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで,実用化されている.本発表では,より日本語に近い非分かち書きの日本語プログラム言語「まほろば」を提案し,その構文の設計の考え方を中心に論じる.20 years ago, programming languages have acquired an ability to handle Japanese. Generalizing it to internationalization (i18n), many of i18n facilities of each programming language were accepted as ISO standards. Some programming languages allowed users to use user-defined words in such multi-octet characters as Kanji. Some new Japanese-based programming languages have also been developed and used. In all those languages, keywords and grammar are based on Japanese, but words have to be separated by spaces. We develop a non-separated (No wakachigaki) version of Japanese-based programming language "Mahoroba". "Mahoroba" is a word of ancient Japan, and means a nice country. This presentation describes its syntax design.
著者
今城 哲二 鈴木 弘 大野 治 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ソフトウェア工学(SE) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.31, pp.143-152, 2001-03-22
被引用文献数
1

約20年前からコンピュータでの漢字利用が普及し,標準ログラム言語で日本語データ処理が可能となった.日本語処理は国際規格化され,いくつかの言語では識別名にも漢字などマルチオクテット文字が使用できる.予約語まで日本語にした本格的な日本語プログム言語も,分かち書きのレベルで,実用化されている.本論文では,分かち書きをしない,より日本語に近い日本語プログラム言語"まほろば"の言語仕様について述べる.20 years ago, programming languages have acquired an ability to handle Japanese. Generalizing it to internationalization (i18n), many of i18n facilities of each programming language were accepted as ISO standards. Some programming languages allow users to use user-defined words in such multi-octet characters as kanji. Some new Japanese-based programming languages have also been developed and used. In all those languages, keywords and grammar are based on Japanese, but words have to be separated by spaces. This paper discusses a non-separated (No wakachigaki) version of Japanese-based programming language "Mahoroba". "Mahoroba" is a word of ancient Japan, and means a nice country. The paper desscribes it's design philosophy and syntax by experimental implementation.
著者
奥 健太 中島 伸介 宮崎 純 植村 俊亮
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.SIG11(TOD34), pp.162-176, 2007-06-15

本論文では,ユーザの状況に応じて適切な情報を提供する状況依存型情報推薦システムのプロトタイプを提案する.膨大な情報からユーザの嗜好に合致する情報を提供する手法として,情報推薦システムに関する研究が行われているが,ユーザのそのときの状況(時間帯や天気,同伴者,予算など)に応じて変化するユーザの嗜好に対し,柔軟に対応することは容易ではない.そこで我々は,状況に応じて変化するユーザの嗜好を適切にモデル化する手法を提案した.本論文では,このモデル化手法を適用した状況依存型情報推薦システムのプロトタイプを提案し,検証実験に基づいて,提案手法の評価を行った.この中で,提案手法であるコンテクスト依存型情報フィルタリングとコンテクスト依存型協調フィルタリングの有効性や特長の違いを明らかにするとともに,対象コンテンツの特徴パラメータの最適化に関して考察した.
著者
植村 俊亮 波多野 賢治 天笠 俊之 吉川 正俊 渡邉 正裕 前田 亮 石川 正敏
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(B)
巻号頁・発行日
1999

インターネット時代を迎えて,地球規模の情報資源が現出しつつあると言われる.WWW(World Wide Web)は,その典型的な例である.しかし,WWWは,ばらばらに構築された,言語も文化も異なるホームページが互いに接続されて,利用可能になっているだけであって,そこから真に必要な知識を発掘する方式はまだ確立されていない.本研究では,WWWに代表される知識資源の大海から,必要な知識を発掘する方式を,とくにその多言語処理面から追求する.具体的には,次の多言語機能をもつ知識発掘システムの実現を目指す.1.ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出すことを可能にする.2.複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる、例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも母国語を使って問い合わせ,知識を発掘することを可能にする.多言語知識発掘システムのため本研究では以下の項目について研究を実践した.1)対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法,2)フォント埋め込み型HTML/XML文書による多言語文書のブラウジングシステムの実現,3)大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発.
著者
石丸 知之 植村 俊亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-コンピュータ (ISSN:09151915)
巻号頁・発行日
vol.78, no.3, pp.349-357, 1995-03-25
被引用文献数
9

本論文では,オブジェクト指向データモデルを拡張した「多態オブジェクト」データモデルを提案する.多態オブジェクトモデルの目的は,マルチメディアデータを自然にデータベース内に表現することである.マルチメディアデータの一つの特徴は,実世界の実体の多用な表現である.多態オブジェクトモデルでは,実体をオブジェクトとして理解し,そのオブジェクトに複数の完結した表現を与えることのできるモデルを提案する.このようなオブジェクトを多態オブジェクトと呼ぶ.多態オブジェクトモデルでは,一つのオブジェクトが複数のインスタンスを表現としてもち得る.クラスはインスタンスの形式を定義する.同じオブジェクトの複数のインスタンスはクラス名で識別する.複数のインスタンスの属性が同一のスーパクラスで定義されているときには,その属性は同一の意味をもつとみなし,インスタンスの間で値を共有し一貫性を達成する.多態オブジェクトの実現例として,現在試作中のデータベース管理システム「沙羅」のアーキテクチャについて述べる.
著者
中島 伸介 舘村 純一 原 良憲 田中 克己 植村 俊亮
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.19, no.2, pp.156-166, 2007-04-15 (Released:2007-08-10)
参考文献数
14
被引用文献数
1 2 1

個人の情報発信やコミュニケーションツールであるblogの利用者が増加している.blog情報は社会的イベントに対する世論そのものであるとも考えられ,これを有効に利用することで即時性および重要性の高い情報の取得が可能であると考えている.そこで我々はWeb上の有識者としての重要なbloggerを発見し,この重要なblogger が発信するコンテンツを利用することで,信頼できる情報の取得が可能ではないかと考えた.本研究では,まずblog データモデルを定義し,重要なblogger の定義とそのタイプ分類を行った.その中でも特に重要と考えたAgitator の判別方法を提案すると共に,実データに基づいてその妥当性に関する考察を行った.提案手法の妥当性の検証方法としては,Agitator判別の再現性に関する検証と,Agitatorであると認定されたblogサイトの正当性の検証を行った.その結果から,提案手法によって重要なbloggerであるAgitator の発見が十分可能であることを示した.
著者
鈴木 優 波多野 賢治 吉川 正俊 植村 俊亮 川越 恭二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.177, pp.195-200, 2004-07-07

現在,多くの検索システムを組み合わせることによって,検索システムの精度を向上させる方法が注目されている.このような検索システムでは,統合関数と呼ばれる,複数のスコアを統合するための関数を変更することによって,精度が向上することが知られている.ところが,最適な統合関数は利用者の問合せによって異なると考えられるため,あらかじめ一意に統合関数を定めることができない.ここで我々は,統合後のスコアの分布から,最適な統合関数を推定することができるのではないかと考えた.そこで本稿では,最適な統合関数を問合せごとに推定する方法として,シャノンの情報量の概念を援用した尺度を用いて,スコアの分布から統合関数の適合度を測定する方法の提案を行う.本提案では,利用者にとって必要な検索対象の数が検索対象全体の数と比較してきわめて少なく,検索結果に含まれる高いスコアの数が少ないとき,その検索結果は十分に正解集合を絞り込んでいると考えることができるため,利用者の検索目的に適した統合関数であると仮定した.評価実験を行うことによって,実際に適した統合関数を選択することができることを示した.
著者
中島 伸介 舘村 純一 原 良憲 田中 克己 植村 俊亮
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
巻号頁・発行日
vol.19, no.2, pp.156-166, 2007-04-15
被引用文献数
2 2

個人の情報発信やコミュニケーションツールであるblogの利用者が増加している.blog情報は社会的イベントに対する世論そのものであるとも考えられ,これを有効に利用することで即時性および重要性の高い情報の取得が可能であると考えている.そこで我々はWeb上の有識者としての重要なbloggerを発見し,この重要なbloggerが発信するコンテンツを利用することで,信頼できる情報の取得が可能ではないかと考えた.本研究では,まずblogデータモデルを定義し,重要なbloggerの定義とそのタイプ分類を行った.その中でも特に重要と考えたAgitatorの判別方法を提案すると共に,実データに基づいてその妥当性に関する考察を行った.提案手法の妥当性の検証方法としては, Agitator判別の再現性に関する検証と,Agitatorであると認定されたblogサイトの正当性の検証を行った.その結果から,提案手法によって重要なbloggerであるAgitatorの発見が十分可能であることを示した.
著者
佐保田 圭介 杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.25-32, 2003-07-16

Web 検索エンジンによって得られる大量の検索結果の中から,個々の利用者が所望の情報を取得することは極めて困難であるため,有用な情報だけを取得する手法の提案が望まれている.そこで,本稿では協調フィルタリングとブックマークの構造を用いたフィルタリングを共に用いて,Web情報検索を支援するシステムを提案する.本研究では,ブックマークはそれを作成した人の Webページに対する有用な知識の集合であると考えているため,ブックマークされている Web ページだけではなくその構造も有用な知識であると考えている.したがって,閲覧している Web ページの持つキーワードを利用して,他の利用者がブックマークしている Web ページを推薦する協調フィルタリング機能を実現し,さらに協調フィルタリング機能によって推薦された Web ページを,ブックマークの構造を利用するフィルタリング機能を用いて厳選し,最終推薦Web ページとして提示するシステムの実現を目指す.It is expected to propose a technique to obtain only useful information for each user. Because,it is quite difficult for users to obtain their desired information among a large amount of search results returned by a Web search engine. Therefore, it is expected to propose a technique for obtaining only useful information for each user. In this paper, we propose an assistant system for user to help users to search Web pages using both collaborative filtering and filtering exploiting the structure of web bookmark. In our study, we regard each user's bookmark as a collection of useful knowledge, so that, we consider not only bookmarked Web pages but also its structure as useful knowledge. Based on these ideas, first we develop a collaborative filtering system that recommends Web pages bookmarked by other users using keywords included in a user's browsing Web page. And then our system carefully select the recommended Web page using filtering system based on the strucuture of bookmark and propose the selected Web pages as final recommended Web pages.