著者
三浦 信幸 横路 誠司 井上 香織 高橋 克巳 高橋 健司 島 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.86, pp.39-44, 1999-11-25

本稿では,インターネット上に存在する雑多な形式の情報を,位置に応じて適切に提供するための情報構造化や情報フィルタリングを行う手法を検討する.このような情報を適切に提供するためには,雑多な形式の情報に対して構造化を行い,構造化された結果を利用して,位置を含めた様々な観点から情報を分類・フィルタリングする必要がある.検討した手法では,情報構造化に際してパターンマッチや特定分野の辞書を用いた形態素解析などを行う.また,情報フィルタリングに際しては,構造化された情報と構造化されなかったHTMLファイル中の名詞や固有名詞の中からtfidf値を参考に頻出する情報を抽出する.さらに,検討した手法のプロトタイプである,モーバイルインフォサーチ3実験(MIS3)について紹介する.
著者
三浦 信幸 高橋 克巳 島 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.5, pp.1523-1535, 1998-05-15
被引用文献数
10

本論文では,個人適応型WWWにおけるユーザモデル構築法を提案する.個人適応型WWWとは,従来の一般的なWWWが,基本的には,すべてのユーザに対して同一の情報内容を同一の情報提示方式で提供してきたのに対し,ユーザモデルとコンテンツモデルの擦合せにより,ユーザ1人1人の特性に応じて提供する情報内容・情報提示方式をユーザごとに動的に変更しながら動作するWWWである.本提案手法の特徴を以下に示す.1)ユーザに余計な負荷となる事前アンケートは用いず,WWWへのアクセス履歴のみからユーザの特性を把握する.2)ユーザモデルをグラフで表現することにより,ユーザのアクセス行動の遷移をモデルに反映できる.3)WWWコンテンツ自身のハイパーリンク構造やコンテンツの意味的な関係を表現したコンテンツモデルとユーザのアクセス履歴を組み合わせてユーザモデルを構築することにより,より多様な個人適応が可能なモデルを構築できる.本論文ではユーザモデルとして,状態モデル・行動モデル・学習モデル・メタモデルの4つを提案し,主に状態モデルについて,実際に外部に公開中の2つのWWWサイトのアクセス履歴に適用し,約4万人分のユーザモデル構築を行い,構築結果の評価実験を行った結果,ユーザ間の相違点・共通点を適度に表現できること,従来法では見つかりにくいユーザ特性を見つけられること等を確認し,提案手法の有効性を示した.This paper proposes a user-models construction method for personal-adaptive WWW.Though Web system has provided same information in same layout to all users,personal-adaptive WWW adapts contents of information and how to users'preferences.Features of our proposal method is as follows.1) User-models are constructed from access histories,not using questionnaires.Questionnaires are excessive works for users.2) User-models are represented as graphs in order to express users'activities.3) User-models are constructed from access histories and WWW contents-models.As WWW contents-models express hyperlink structures of contents and semantic relationships among contents.These user-models enable more various personal-adaptations.We define four user-models,user-status model user-activity model,user-learning model and user-meta model.We show experimental results of constructing user-models,especially user-status model,from access histories of real two public WWW sites.We constructed fourty thousand users'models and the results show effectiveness of our method in the viewpoints that we can get more various and more interesting users'profiles than what are produced by usual construction methods and that constructed user-models have both different points and common points.
著者
横路 誠司 高橋 克巳 三浦 信幸 島 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.7, pp.1987-1998, 2000-07-15
参考文献数
17
被引用文献数
13

インターネット上に分散するWWW文書を位置指向に検索するシステムを開発した.本システムでは,任意の地理的領域に属するWWW文書を検索することが可能である.本検索システムの実現のために,3つの手法を開発した.まず,位置指向検索に必要なWWW文書を選択的に収集する手法,次に,WWW文書から住所を抽出し,抽出住所を緯度経度と対応づけることによる構造化手法,そして,構造化された文書の緯度経度を用いた,地理的検索手法である.選択的収集手法は,WWW文書の内容を予測し,位置に関連した情報を高い割合で収集することができる.構造化手法では,住所辞書を持った形態素解析と,住所表記の正規化を用いて,WWW文書からの住所抽出を行った.その結果,正しい住所の抽出を保証したうえで,出現住所文字列の92%の抽出を丁目レベルで実現した.地理的検索手法では,構造化で付与された緯度経度情報と検索領域の重なりに存在するWWW文書の情報を提示する.この手法の評価実験を行った結果,提案手法は,検索領域として住所文字列を使用する従来のキーワード検索で少なくとも約25%存在していた検索もれを解消することができた."We developed a location-oriented search system for WWW documents on the Internet.This system can search WWW documents related to any geographical area.The system has three modules.(1) ``Location oriented selective information collecting robot''that collects documents from the Internet,(2) ``Location oriented structuring parser''that extracts address strings from the WWW documents andputs longitude-latitude information to the original document,(3) ``Location oriented structured search'' that performs geographical search.Our ``robot'' collects documents related to the location selectivelyby estimating the target document has the location information or not.Our ``parser'' extracts address strings using the morphological analysis andnormalization of address variants.It extracts 92% of detailed address strings while guaranteeingthe precision of the extraction.And our ``location oriented search'' method searches the documents whichits longitude-latitude overlaps to the polygon of the search request.This method can search all documentsthat conventional keyword search overlooks at least 25% of documents.