著者
中本聖也 北野光一 寺口敏生 田中成典 西江将男
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.783-785, 2011-03-02

近年,リアルタイム性の高いCGMであるマイクロブログの利用が増加している.マイクロブログは,実世界とWebをリアルタイムに結び付けることができるため,位置情報サービスの分野で注目されている.しかし,マイクロブログに投稿される情報は膨大な量であり,特定の地域における話題のみを抽出することが困難である.そこで,マイクロブログから場所に関する単語のバーストを検出し,話題性が高い地域を抽出する研究が行われている.しかし,バーストのみに着目した解析では,日常的な地名の出現傾向の違いを考慮できない問題がある.そこで,本研究では,地域における話題を類型化することで,マイクロブログから地域の話題を適切に抽出する手法を提案する.
著者
小泉陽子 北野光一 寺口敏生 田中成典 大谷和史
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.543-545, 2011-03-02

近年,知人間でコミュニティを構築するSNSが広く普及している.しかし,SNSでは,知人間のコミュニティであるという安心感から,個人情報に関する配慮が疎かになってしまい,無意識のうちに自他の個人情報を漏洩しがちな点が問題となっている.そこで,SNSの日記から無意識に記載された個人情報を抽出する研究が行われているが,単体の投稿内容にだけに着目しており,過去にコミュニティ上に投稿された全ての日記の内容を統合的に取り扱っていないため,複数の日記を考慮することで特定できる個人情報に対応できない.そこで,本研究では,あるコミュニティの全ての日記を解析し,公開されている情報を組み合わせて自他を含む個人情報の漏洩状況を分析する手法を提案し,個人情報の流出を警告することを目指す.
著者
中村 健二 田中 成典 北野 光一 寺口 敏生 大谷 和史
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.1, pp.90-104, 2012-01-15

携帯電話利用者の低年齢化にともない,インターネットを介して子ども同士がコミュニケーションを図ることによって,有害な影響を受けたり事件に巻き込まれたりする事案の増加が問題となっている.しかし,現実世界とは異なり,インターネット上では保護者が子供の振舞いや交友関係を把握することは難しいため,十分な見守りが行えないという課題がある.そのため,人手によるネットパトロールなどの活動が実施されているが,膨大な人的コストが必要となるうえに,監視漏れが発生してしまうため,Webマイニング技術を活用した支援が検討されている.しかし,インターネットでは,各ユーザが複数のWebページを用いてコミュニケーションを図るという特性があるため,一般的なWebクローラでは十分な情報収集が行えない.さらに,インターネット上には膨大な量のWebページが開設されているため,解析対象をランダムに選択する手法では,解析効率が悪いという問題がある.そこで,本研究では,インターネット上から非行逸脱傾向が高い有害ユーザを効率的に発見するマルチエージェントクローラを開発し,ネットパトロールの効率化の実現に取り組んだ.The use of mobile phones is increasingly spreading among younger people. This phenomenon leads to a concern that more children are susceptible to harmful information on the Internet or are even involved in criminal cases. It is rather difficult for parents or guardians to constantly watch their children's behavior and know everything about their interactions on the Internet. This is why activities such as "Net Patrol" have been implemented. However, such activities require an enormous labor cost and can't observe whole children's behavior without omission, and thus, web mining tools are needed to support. Ordinary web crawlers are incapable of collecting sufficient information because of the characteristic of the Internet that communication happens with a multiple services combined. In addition, random analyses using crawlers are inefficient. For these reasons, a new approach is needed to identify an individual on the Internet and collect that person's information efficiently. This study aims to develop a multi-agent crawler that can identify harmful users who tend to indulge in misconduct efficiently, and thus, improve the efficiency of Net Patrol.
著者
中村 健二 田中 成典 古田 均 吉村 智史 北野 光一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.49, no.7, pp.2480-2492, 2008-07-15

近年,インターネットを利用した日常的な情報収集活動において,即時性と信頼性に優れたWebニュースは人々の情報源として広く活用されている.しかし,日々時々刻々と増加する膨大な数のWebニュースから特定のトピックだけを抽出することは困難である.そのため,文書間の類似度を利用してトピックを分類する研究や時系列的な特性に基づきトピックを抽出する研究が活発に行われている.しかし,これら既存研究では,文書中に出現する単語群に依存した分類しかできず,また任意の期間に発生するトピックに適切な単語を関連付けできないという課題がある.そこで,本研究では,時系列的な特性に基づいて抽出したバースト語を用いて,バースト語間の関連を考慮した最新のトピックを抽出する手法を提案する.そして,既研究の従来手法と比較実験を行い,本提案手法の有用性を実証する.