著者
井筒 清史 横澤 誠 篠原 健
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.32, pp.25-32, 2005-03-19
被引用文献数
2

Webの高度な利活用のニーズとして,社会的な出来事に関してWeb空間上でのWebページ数の反応の把握がある.このニーズに応える手段として,Webページをインデキシングする技術であるWebの自動分類手法を用いることにした.本稿では,Webの自動分類器を作成し,社会的な出来事を把握するために利用し,その技術の有効な利用シーンを提示する.Webの自動分類器を作成するために,判別分析,Rule base,Naive Bayesの代表的な3つの手法の応用領域での性質について調べた.Webの自動分類手法の有効な利用方法を提示するため,ここでは特にRule Base分類器によるスマトラ島沖地震とノートパソコンの新製品販売・発表に関する時系列分析の実験を行った.各出来事が起こる前後で,予め定めたカテゴリーごとにWebページの数に特徴的な反応があることが観測された.Numbers of web pages about social incidents are expected to be a good index of how the incident is considered in web communities. Possibilities were shown in this study that automated web page classification method can help those numerical analysis of web space. Discriminant Analysis method, Rule-Based method and Naive Bayes method were compared by their classification accuracy, developers' cost, users' cost, processing time and scalability. Practical experiments about the Sumatran Earthquake/Tsunami and a new Note PC Product show communities response differently around the time of the incidents.