著者
新里圭司 絹川 博之
雑誌
情報処理学会研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2002, no.28(2001-DD-032), pp.95-102, 2002-03-15

パソコンや各種携帯端末の普及により、多くの人がインターネット上のデータベースを利用することが可能になった。しかし、以下に示す課題が残っている.(1)情報機器に不慣れなユーザにとって,複雑な論理条件からなる検索要求を指定するのは難しい.(2)パソコンのディスプレイと比べ携帯端末等の表示画面領域は狭いため、多くの検索条件指定項目を表示することができず、ユーザが満足する検索要求を指定することは難しい.このような問題を解決する一つの方法として、会話的表現によるデータベース操作可能な自然言語インタフェースが考えられる.本研究では,図書データベースシステムの検索操作を対象に,パソコンや携帯電話からアクセス可能な自然言語インタフェース処理方式を開発することとした.
著者
馬塲康夫 新里圭司 黒橋 禎夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2008, no.4, pp.67-74, 2008-01-22
被引用文献数
3

本稿では,検索エンジン基盤TSUBAKIを使って検索されたウェブページを,ページ中の複合名詞に注目して自動的にクラスタリングするシステムについて述べる.検索エンジン基盤TSUBAKI とは 日本語ウェブページ1億件を対象にした研究用途に主眼をおいた検索エンジンである.本クラスタリングシステムは,このTSUBAKIと連係することで,数千から数万件のウェブページを分類することが可能であり,さらに,豊富な言語情報を利用した高精度な複合名詞抽出を行うことが可能である.簡単な評価実験の結果,本システムを用いることでTSUBAKIの検索結果中で下位に埋もれているウェブページに対し効率よくアクセスできること,さらには,抽出した複合名詞が有用な情報へアクセスする際に有効であることがわかった.This paper describes a system that organizes a large number of web pages retrieved from the search engine TSUBAKI into clusters according to compound nouns extracted from the pages. TSUBAKI is a search engine infrastructure that can retrieve pages from 100 million web pages. Our clustering system deeply cooperates with TSUBAKI. This enables the system to generate clusters from several thousand web pages, and to give elaborate labels to the clusters. Experimental results showed that our system users can efficiently access low-ranked web pages in a search result obtained from TSUBAKI, and that generated labels navigate the users to information that they want.