著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.Research is being conducted on technology to get users' reactions to specific topics in microblogs. It is necessary to know the users' characteristics in order to effectively utilize microblogs as social sensors. However, it cannot understand the users' characteristics, because user attributes are not often to the public in microblogs. For this reason, research on estimating user attributes in microblogs has been drawing attention. However, existing methods, which merely focus on the description contents in microblogs, do not take advantage of the characteristics in microblogs that transmit in real time to estimate users' attributes. This research proposes a method for classifying the users according to number of posts per unit time and estimating the occupation attributes by description contents, lifestyle and time zone of posts. Our demonstration experiments verify usability of the proposed method by comparing the existing methods of estimating merely using description contents with the proposed method of estimating using description contents and temporal characteristics.
著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.
著者
田中 成典 中村 健二 寺口 敏生 中本 聖也 加藤 諒
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.3, pp.73-89, 2013-06-28

携帯端末の普及にともない,ユーザの状況に応じて様々な情報をリアルタイムに提供するサービスに注目が集まっている.そのため,GPSから取得した位置情報や,マイクロブログの投稿内容からユーザの行動を推定する研究が行われている.著者らは,これらに加えて,新たにユーザの習慣的な行動に着目した推定手法について検討を行った.本研究では,マイクロブログにおけるユーザの投稿内容と投稿数の変化から行動のパターンを抽出し,指定した時間帯における習慣的な行動を推定する手法を提案する.この手法により,マイクロブログの投稿内容には行動に関する記述がない場合でも,指定した時間帯におけるユーザの行動を推定できる.実証実験では,投稿内容のみを用いた手法と習慣行動もあわせて考慮する本手法とを比較し,提案手法の有用性について検証した.Services to provide variety of information in real time with reference to users' situations are receiving attention, as portable terminals have become widespread. Accordingly, some studies are being made to estimate the users' activities from their location information obtained by GPS or from the contents of their microblog posts. In addition to these, the author and his colleagues examined a new estimation approach focused on the habitual behavior of users. The present study proposes an estimation method of users' habitual behavior within designated periods of time by extracting behavioral patterns from the changes in contents and numbers of their posts in microblogs. This method enables estimation of users' behavior within designated time periods without any behavioral description provided in their microblog posts. Our demonstration experiments compare a method of merely using posted contents with this method that also considers habitual behavior as well, and verify its usability.
著者
中本聖也 北野光一 寺口敏生 田中成典 西江将男
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.783-785, 2011-03-02

近年,リアルタイム性の高いCGMであるマイクロブログの利用が増加している.マイクロブログは,実世界とWebをリアルタイムに結び付けることができるため,位置情報サービスの分野で注目されている.しかし,マイクロブログに投稿される情報は膨大な量であり,特定の地域における話題のみを抽出することが困難である.そこで,マイクロブログから場所に関する単語のバーストを検出し,話題性が高い地域を抽出する研究が行われている.しかし,バーストのみに着目した解析では,日常的な地名の出現傾向の違いを考慮できない問題がある.そこで,本研究では,地域における話題を類型化することで,マイクロブログから地域の話題を適切に抽出する手法を提案する.
著者
寺口 敏生 田中 成典 西江 将男
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.23, no.4, pp.411-427, 2011-08-15 (Released:2011-11-04)
参考文献数
31

近年,情報関連技術の普及と発展に伴い,カーナビゲーションを代表とする地理空間情報サービスが普及している.しかし,地理空間情報サービスの基盤となる地図情報の整備は人手による現地踏査に依存しているため,新店舗の開店などの実空間の情報変化に地図情報が追従できていない問題がある.そこで,著者らは,Web上の新店舗の開店情報を対象として,自然言語から店舗名,住所や業種などの店舗情報を自動収集するテキストマイニングの研究を行ってきた.しかし,新規開店に関連するキーワードだけを用いてマイニングを行った場合,業種別の単語出現傾向の違いや,単語の連接関係によって生じるノイズなどの自然言語の曖昧性に起因する課題に加え,情報自体の正誤を評価できないという課題に直面した.そこで,本研究では,キーワードによるマイニングに加え,マーケティング分析の指標に基づいて,店舗の業種と出店位置の地理的特性との関係を活用することで,これらの課題を克服することを目指す.実験から,地理的特性を考慮した情報を評価することによって,新店舗に関する開店情報を高精度に取得できることを実証した.
著者
小泉陽子 北野光一 寺口敏生 田中成典 大谷和史
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.543-545, 2011-03-02

近年,知人間でコミュニティを構築するSNSが広く普及している.しかし,SNSでは,知人間のコミュニティであるという安心感から,個人情報に関する配慮が疎かになってしまい,無意識のうちに自他の個人情報を漏洩しがちな点が問題となっている.そこで,SNSの日記から無意識に記載された個人情報を抽出する研究が行われているが,単体の投稿内容にだけに着目しており,過去にコミュニティ上に投稿された全ての日記の内容を統合的に取り扱っていないため,複数の日記を考慮することで特定できる個人情報に対応できない.そこで,本研究では,あるコミュニティの全ての日記を解析し,公開されている情報を組み合わせて自他を含む個人情報の漏洩状況を分析する手法を提案し,個人情報の流出を警告することを目指す.
著者
中村 健二 田中 成典 北野 光一 寺口 敏生 大谷 和史
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.1, pp.90-104, 2012-01-15

携帯電話利用者の低年齢化にともない,インターネットを介して子ども同士がコミュニケーションを図ることによって,有害な影響を受けたり事件に巻き込まれたりする事案の増加が問題となっている.しかし,現実世界とは異なり,インターネット上では保護者が子供の振舞いや交友関係を把握することは難しいため,十分な見守りが行えないという課題がある.そのため,人手によるネットパトロールなどの活動が実施されているが,膨大な人的コストが必要となるうえに,監視漏れが発生してしまうため,Webマイニング技術を活用した支援が検討されている.しかし,インターネットでは,各ユーザが複数のWebページを用いてコミュニケーションを図るという特性があるため,一般的なWebクローラでは十分な情報収集が行えない.さらに,インターネット上には膨大な量のWebページが開設されているため,解析対象をランダムに選択する手法では,解析効率が悪いという問題がある.そこで,本研究では,インターネット上から非行逸脱傾向が高い有害ユーザを効率的に発見するマルチエージェントクローラを開発し,ネットパトロールの効率化の実現に取り組んだ.The use of mobile phones is increasingly spreading among younger people. This phenomenon leads to a concern that more children are susceptible to harmful information on the Internet or are even involved in criminal cases. It is rather difficult for parents or guardians to constantly watch their children's behavior and know everything about their interactions on the Internet. This is why activities such as "Net Patrol" have been implemented. However, such activities require an enormous labor cost and can't observe whole children's behavior without omission, and thus, web mining tools are needed to support. Ordinary web crawlers are incapable of collecting sufficient information because of the characteristic of the Internet that communication happens with a multiple services combined. In addition, random analyses using crawlers are inefficient. For these reasons, a new approach is needed to identify an individual on the Internet and collect that person's information efficiently. This study aims to develop a multi-agent crawler that can identify harmful users who tend to indulge in misconduct efficiently, and thus, improve the efficiency of Net Patrol.