著者
佐保田 圭介 杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.25-32, 2003-07-16

Web 検索エンジンによって得られる大量の検索結果の中から,個々の利用者が所望の情報を取得することは極めて困難であるため,有用な情報だけを取得する手法の提案が望まれている.そこで,本稿では協調フィルタリングとブックマークの構造を用いたフィルタリングを共に用いて,Web情報検索を支援するシステムを提案する.本研究では,ブックマークはそれを作成した人の Webページに対する有用な知識の集合であると考えているため,ブックマークされている Web ページだけではなくその構造も有用な知識であると考えている.したがって,閲覧している Web ページの持つキーワードを利用して,他の利用者がブックマークしている Web ページを推薦する協調フィルタリング機能を実現し,さらに協調フィルタリング機能によって推薦された Web ページを,ブックマークの構造を利用するフィルタリング機能を用いて厳選し,最終推薦Web ページとして提示するシステムの実現を目指す.It is expected to propose a technique to obtain only useful information for each user. Because,it is quite difficult for users to obtain their desired information among a large amount of search results returned by a Web search engine. Therefore, it is expected to propose a technique for obtaining only useful information for each user. In this paper, we propose an assistant system for user to help users to search Web pages using both collaborative filtering and filtering exploiting the structure of web bookmark. In our study, we regard each user's bookmark as a collection of useful knowledge, so that, we consider not only bookmarked Web pages but also its structure as useful knowledge. Based on these ideas, first we develop a collaborative filtering system that recommends Web pages bookmarked by other users using keywords included in a user's browsing Web page. And then our system carefully select the recommended Web page using filtering system based on the strucuture of bookmark and propose the selected Web pages as final recommended Web pages.
著者
吉川 隆英 田浦 健次朗 近山 隆
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.43, no.8, pp.111-111, 2002-09-15

世代GC 方式において,新たに生成されたデータは,何回かのGC を経た後,旧世代領域に移される.これを「殿堂入り」という.殿堂入り時期が遅すぎると,長寿命データと新世代ゴミが長期間新世代メモリ領域に混在するため,ユーザプログラム中や新世代GC 中でのキャッシュヒット率が低下する.逆に,殿堂入り時期が早すぎると,短寿命データが新世代領域で回収できず,新世代GC の回収効率が悪化し,旧世代GC が発生しやすくなる.殿堂入りの適切な時期は,プログラムによって,また1 つのプログラムの中でもその実行フェーズによって異なる.これまで,プログラム実行時に動的に殿堂入り時期を調節する手法はいろいろ提案されてきたが,主に新世代GC の回収効率を改善することに主眼がおかれており,キャッシュの効果が,動的な殿堂入り時期調節の基準に,実験データに裏打ちされる形で明快に反映されていなかった.そこで本研究では,まず,様々なプログラムにおいて,実際のデータ寿命分布,殿堂入り時期の違いによるキャッシュミス数と実行時間の測定を行い,メモリ領域中のデータの振舞いに対するモデルを作成した.そして,このモデルに基づく殿堂入り時期調節手法の提案を行った.また,この殿堂入り時期調節手法を,ヒープサイズを自動調節する世代GC を行う並行並列論理型言語処理系KLIC 上に実装し,動的に殿堂入り時期調節を行わない世代GC との性能比較を行った.In generational GC schemes, objects are allocated to the young generation area and are advanced to the old generation area after surviving a small number of collections. This advancement is called tenuring. Tenuring too late makes some short-lived objects that some of them have already become garbage and long-lived objectsreside together in the young generation, making memory reference locality worse. On the other hand, tenuring too early makes it impossible to collect short-lived objects in the young generation; its mark/cons ratio becomes worse and, as short-lived objects are moved to the older generation, more older generation GCs will be required. For the best performance, we should adjust tenuring timings dynamically according to programs and their execution phases. Many adaptive tenuring policies have been proposed.However, most of them aim at improving mark/cons ratio of the younger generation and improvementsin cache performance are not proven with experimental evidences. In this work, we (1) measure object lifetime distributions on several programs, and how cache misses and execution times vary with different tenuring timings, (2) make a simple analytical model to estimate an appropriate young generation size, (3) propose a cache-conscious adaptive tenuring policy, and (4) implement dynamic young generation size adjustment mechanism with this policy into KLIC and compare its execution time to one with conventional generational GC on several programs.