著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.Research is being conducted on technology to get users' reactions to specific topics in microblogs. It is necessary to know the users' characteristics in order to effectively utilize microblogs as social sensors. However, it cannot understand the users' characteristics, because user attributes are not often to the public in microblogs. For this reason, research on estimating user attributes in microblogs has been drawing attention. However, existing methods, which merely focus on the description contents in microblogs, do not take advantage of the characteristics in microblogs that transmit in real time to estimate users' attributes. This research proposes a method for classifying the users according to number of posts per unit time and estimating the occupation attributes by description contents, lifestyle and time zone of posts. Our demonstration experiments verify usability of the proposed method by comparing the existing methods of estimating merely using description contents with the proposed method of estimating using description contents and temporal characteristics.
著者
田中 成典 中村 健二 加藤 諒 寺口 敏生
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.5, pp.71-84, 2013-12-27

マイクロブログから特定の話題に対するユーザの反応を取得する技術が研究されている.マイクロブログをソーシャルセンサとして有効活用するには,ユーザごとの特性を知る必要がある.しかし,マイクロブログでは,ユーザが属性を公開していない場合が多々あるため,ユーザごとの特性を把握できない.このことから,マイクロブログのユーザ属性を推定する研究が注目されている.しかし,既存手法では,主にマイクロブログの投稿内容にのみ着目しており,リアルタイムに発信されるマイクロブログの特性を属性推定に活かせていない.そこで,本研究では,各単位時間の投稿数に基づきユーザをクラスタリングし,投稿内容,生活習慣と投稿時間帯から職業属性を推定する手法を提案する.実証実験では,投稿内容のみを使用して推定する既存手法と,時間的特徴をも考慮する本手法について比較実験を行い,本提案手法の有用性を確認した.
著者
田中 成典 中村 健二 寺口 敏生 中本 聖也 加藤 諒
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.3, pp.73-89, 2013-06-28

携帯端末の普及にともない,ユーザの状況に応じて様々な情報をリアルタイムに提供するサービスに注目が集まっている.そのため,GPSから取得した位置情報や,マイクロブログの投稿内容からユーザの行動を推定する研究が行われている.著者らは,これらに加えて,新たにユーザの習慣的な行動に着目した推定手法について検討を行った.本研究では,マイクロブログにおけるユーザの投稿内容と投稿数の変化から行動のパターンを抽出し,指定した時間帯における習慣的な行動を推定する手法を提案する.この手法により,マイクロブログの投稿内容には行動に関する記述がない場合でも,指定した時間帯におけるユーザの行動を推定できる.実証実験では,投稿内容のみを用いた手法と習慣行動もあわせて考慮する本手法とを比較し,提案手法の有用性について検証した.Services to provide variety of information in real time with reference to users' situations are receiving attention, as portable terminals have become widespread. Accordingly, some studies are being made to estimate the users' activities from their location information obtained by GPS or from the contents of their microblog posts. In addition to these, the author and his colleagues examined a new estimation approach focused on the habitual behavior of users. The present study proposes an estimation method of users' habitual behavior within designated periods of time by extracting behavioral patterns from the changes in contents and numbers of their posts in microblogs. This method enables estimation of users' behavior within designated time periods without any behavioral description provided in their microblog posts. Our demonstration experiments compare a method of merely using posted contents with this method that also considers habitual behavior as well, and verify its usability.
著者
安彦 智史 加藤 諒 北川 悦司
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.61, no.3, pp.535-543, 2020-03-15

近年のインターネット社会では,SNS(Social Networking Service)の利用による薬物売買や児童ポルノ,自殺幇助といった様々なサイバー犯罪が問題視されている.特に薬物売買は,インターネットの匿名性を利用した売買手法について潜在化や巧妙化が進行しており,平成29年では薬物利用による検挙人員の約半数は青少年であった.そのため,厚生労働省では,警察庁と連携し,有害情報をフィルタリングするシステムの導入を促進しているが,検挙人員の低下にはつながっていない.さらに公開型のSNSを中心に,薬物売買を示唆するアカウントが頻繁に作成されているため,個別に対応するだけでは根本的な解決につなげることは難しいという課題がある.そこで,本研究では,特に重要度が高いとされるマイクロブログを対象に,機械学習を用いて薬物売買を行うユーザの自動抽出を試みる.さらに,ユーザ間の関係から,薬物売買に興味があるコミュニティを包括的に把握可能なシステムを開発する.実証実験の結果,薬物売買に関連するユーザを高精度に抽出し,ユーザの有害判定やネットワークの可視化を実現できることを証明した.
著者
星野 崇宏 繁桝 算男 猪狩 良介 加藤 諒
出版者
慶應義塾大学
雑誌
基盤研究(B)
巻号頁・発行日
2018-04-01

本研究の研究目的はルービン因果モデルの枠組みを拡張し、店舗と消費者、病院と患者、クラスと生徒のような階層性のあるクラスターデータにおける因果効果の異質性や、同一個人でも何らかの要因により介入効果が異なる個人レベルの効果の異質性について統一的なモデル表現を行い、既存手法で生じるバイアスを回避する効率的な推定法を開発することを目的としている。一昨年度に進展した理論研究のうち特にpotential outcome間の同時分布の識別条件とその推定方法についての研究をもとに、研究計画の(1)クラスターあるいは個別ごとの介入の最適化についての研究や、(3)適応的デザインでの解析への応用に直接有用であり、また(5)母集団情報やマクロデータ、代表性のあるデータを利用した補正についての理論研究に注力して研究を行った。さらに、これに関連するシミュレーション研究を大規模に実施した。理論的な研究の成果を海外学会での発表および海外著名誌に論文投稿を行いその一部については採択され、他は現在審査中である、また、応用研究としてレセプトデータ、教育データとマーケティングデータについては(1)と(3)の分野について研究を実施し、応用研究についてはまずは国内外の学会に発表したあと、一部海外雑誌に掲載させ、他にも国内外の査読雑誌に投稿準備中である。特に理論的な研究成果は一昨年度は論文投稿を中心としたため、昨年度は海外学会でも発表を行った。