著者
土方 嘉徳 青木 義則 古井 陽之助 中島 周
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.566-576, 2002-02-15
被引用文献数
10

情報検索におけるユーザ分析では,ユーザが閲覧したコンテンツのどの部分に興味を持ったのかを取得することが重要となる.既存の手法でこのようなユーザの興味に関する情報を取得しようとすると,ユーザにアンケートに答えてもらうという手間をかける問題や,Webページ中の一部分というような細かい単位では自動取得できないという問題があった.本稿では,ユーザのWebページ閲覧中のマウス操作を利用して,ユーザが興味を持ったと思われるテキスト部分を全体のテキストから自動抽出する手法を提案する.本研究では,まず事前調査としてユーザのWebページ閲覧中のマウス操作の観察とインタビューを行い,どのような種類の操作がユーザの興味と関連があるのかを明らかにする.次に,これらの操作の対象となるテキスト部分が実際にユーザが興味を持った部分であるのか否かを,「TextExtractor」と呼ぶ実験システムを実装し,被験者実験を行うことで検証する.実験の結果,テキスト中におけるユーザが興味を持ったキーワードの割合は,文書全体よりも,これら各々の種類の操作が対象とするテキスト部分の方が高いことが検証された.また,これらの操作すべてを使ってテキスト部分を抽出した場合,ユーザが興味を持ったキーワードを抽出する精度は,ランダムにキーワードを抽出する方法に比べて約4倍,tf・idfに比べて約1.4倍高いことが確認できた.In the area of information retrieval, it becomes important to acquire which portion of the content the user was interested in. The existing techniques for acquiring this information have the problem which forces the user to answer questionnaires or the problem which cannot carry out automatic acquisition in a fine unit like the portion in a Web page. This paper proposes a method for extracting the text parts which the user might be interested in from the whole text of the Web page based on the user's mouse operation.First, we conduct observations and interviews to discover what kind of operation is related to the user's interest.Second, we build a system called ``TextExtractor'' and conduct an experiment to see the effectiveness of the discovered operations. The result showed that the ratio of the keywords which the user was interested in was higher in the targeted text parts of any kind of the discovered operations than that in the whole document.When we extracted texts using all kinds of discovered operations, the precision to extract keywords of TextExtractor was about 4 times compared with that of random extraction and about 1.4 times compared with that of tf-idf.

言及状況

Twitter (1 users, 1 posts, 2 favorites)

ユーザーの興味と関係するマウス操作: 1.テキストをなぞる(該当箇所or該当箇所の下 を なぞるor右に短く動かす)。 2.リンクにマウスを合わせる(クリックはしない)。 3.リンクをクリックする。 4.テキストをドラッグして選択する。 http://t.co/fsTPExlQ

収集済み URL リスト