著者
岩崎 祐貴 折原 良平 清 雄一 中川 博之 田原 康之 大須賀 昭彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.152-160, 2015-01-06 (Released:2015-01-06)
参考文献数
30

Nowadays, anybody can easily express their opinion publicly through Consumer Generated Media. Because of this, a phenomenon of flooding criticism on the Internet, called flaming, frequently occurs. Although there are strong demands for flaming management, a service to reduce damage caused by a flaming after one occurs, it is very difficult to properly do so in practice. We are trying to keep the flaming from happening. It is necessary to identify the situation and the remark which are likely to cause flaming for our goal. Concretely, we propose methods to identify a potential tweet which will be a likely candidate of a flaming on Twitter, considering public opinion among Twitter users. Among three categories of flamings, our main focus is Struggles between Conflicting Values (SBCV), which is defined as a remark that forces one's own opinion about a topic on others. Forecasting of this type of flamings is potentially desired since most of its victims are celebrities, who need to care one's own social images. We proceed with a working hypothesis: a SBCV is caused by a gap between the polarity of the remark and that of public opinion. First, we have visualized the process how a remark gets flamed when its content is far from public opinion, by means of our original parameter daily polarity (dp). Second, we have built a highly accurate flaming prediction model with decision tree learning, using cumulative dp as an attribute along with parameters available from Twitter APIs. The experimental result suggests that the hypothesis is correct.
著者
ミンテイ グェン 川村 隆浩 田原 康之 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.110, no.105, pp.19-23, 2010-06-18

本論文の目的は,twitterから取得した文中に現れる行動の基本属性(行動主,動作,対象,時間,場所)を自動的に抽出することである.しかし,先行研究では,頻度が低い行動を獲得できない.そして,抽出する前に,動詞リストとカテゴリワード(対象を表すワード)を予め準備しておく必要がある.そこで本論文では,条件付確率場(Conditional Random Fields)と自己教師あり学習(Self-Supervised Learning)を用いて,行動属性の自動抽出手法を提案する.提案手法では,人手でラベル編集や行動のドメインの定義などの必要がなく,頻度が低い行動も獲得できる.
著者
住元 宗一朗 中川 博之 田原 康之 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.11, pp.1800-1811, 2011-11-01

近年増加したコンテンツ投稿型SNSでは日々膨大にコンテンツが増え続けるため,嗜好には合っているもののユーザが見逃してしまうようなコンテンツは少なくない.また,多くの推薦技術では精度を重視するあまり,その推薦結果に面白みがないという課題がある.本論文では,主に音楽,イラスト,詩等の創作者向けであるコンテンツ投稿型SNSにおける未知性,意外性を考慮した推薦手法について述べる.未知性に関しては,質の高いコンテンツを投稿する投稿者(有力投稿者)に注目し,コンテンツの質を確保しつつもロングテールのテール部分に属する,ユーザがまだ知らないコンテンツを推薦する.意外性に関しては,多くのコンテンツ投稿型SNSで利用されているFolksonomyを利用する.以上の二つの推薦部からなる推薦エージェントを提案し,イラスト投稿型SNSであるPixivの実データを用い,未知性,意外性に関する評価実験を実施した.その結果,推薦リストの6割に未知性,意外性のあるコンテンツが含まれ,本研究の有効性が確かめられた.
著者
田代 和浩 川村 隆浩 清 雄一 中川 博之 田原 康之 大須賀 昭彦
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.31, no.3, pp.3_58-3_69, 2014-07-25 (Released:2014-09-25)

近年,多数のアイドルグループが人気を博しており,知名度や社会での影響力が大きくなっている.それに伴い,これらのアイドルの画像をポーズごとに分類し,鑑賞したいというニーズがアイドルファン内で高まっている.本研究は,アイドルのポーズを分析し,ユーザーに代わって分類してくれるエージェントを提案する.提案手法は大きくポーズ推定とポーズ分類の2つの処理に分かれている.ポーズ推定によって取得できる画像内人物の体のパーツ位置情報を特徴ベクトルとし,ポーズ分類によって8つのクラスへと画像を分類する.ポーズ分類の際,分類精度をより高めるため,Human Pose Guide Ontology(HPGO)を提案する.HPGOは人体構造に関する制約条件を内包し,ポーズ推定で得られた体のパーツ位置情報に補正を加えることで,分類精度を高める働きをする.評価実験により,提案手法の有用性を示し,実験結果について考察を行う.
著者
住元 宗一朗 中川 博之 田原 康之 大須賀 昭彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.11, pp.1800-1811, 2011-11-01

近年増加したコンテンツ投稿型SNSでは日々膨大にコンテンツが増え続けるため,嗜好には合っているもののユーザが見逃してしまうようなコンテンツは少なくない.また,多くの推薦技術では精度を重視するあまり,その推薦結果に面白みがないという課題がある.本論文では,主に音楽,イラスト,詩等の創作者向けであるコンテンツ投稿型SNSにおける未知性,意外性を考慮した推薦手法について述べる.未知性に関しては,質の高いコンテンツを投稿する投稿者(有力投稿者)に注目し,コンテンツの質を確保しつつもロングテールのテール部分に属する,ユーザがまだ知らないコンテンツを推薦する.意外性に関しては,多くのコンテンツ投稿型SNSで利用されているFolksonomyを利用する.以上の二つの推薦部からなる推薦エージェントを提案し,イラスト投稿型SNSであるPixivの実データを用い,未知性,意外性に関する評価実験を実施した.その結果,推薦リストの6割に未知性,意外性のあるコンテンツが含まれ,本研究の有効性が確かめられた.
著者
芦川 将之 川村 隆浩 大須賀 昭彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.3, pp.B-G81_1-13, 2017-05-01 (Released:2017-05-01)
参考文献数
31

Current crowdsourcing platforms such as Amazon Mechanical Turk provide an attractive solution Crowdsourcing platforms provide an attractive solution for processing numerous tasks at a low cost. However, insufficient quality control remains a major concern. Therefore, we developed a private crowdsourcing system that allows us to devise quality control methods. In the present study, we propose a grade-based training method for workers in order to avoid simple exclusion of low-quality workers and shrinkage of the crowdsourcing market in the near future. Our training method utilizes probabilistic networks to estimate correlations between tasks based on workers’ records for 18.5 million tasks and then allocates pre-learning tasks to the workers to raise the accuracy of target tasks according to the task correlations. In an experiment, the method automatically allocated 31 pre-learning task categories for 9 target task categories, and after the training of the pre-learning tasks, we confirmed that the accuracy of the target tasks was raised by 7.8 points on average. This result was comparatively higher than those of pre-learning tasks allocated using other methods, such as decision trees. We thus confirmed that the task correlations can be estimated using a large amount of worker records, and that these are useful for the grade-based training of low-quality workers.
著者
芦川 将之 川村 隆浩 大須賀 昭彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.6, pp.503-515, 2014-11-01 (Released:2014-09-25)
参考文献数
25

Open Crowdsourcing platforms like Amazon Mechanical Turk provide an attractive solution for process of high volume tasks with low costs. However problems of quality control is still of major interest. In this paper, we design a private crowdsourcing system, where we can devise methods for the quality control. For the quality control, we introduce four worker selection methods, each of which we call preprocessing filtering, real-time filtering, post processing filtering, and guess processing filtering. These methods include a novel approach, which utilizes a collaborative filtering technique in addition to a basic approach of initial training or gold standard data. For an use case, we have built a very large dictionary, which is necessary for Large Vocabulary Continuous Speech Recognition and Text-to-Speech. We show how the system yields high quality results for some difficult tasks of word extraction, part-of-speech tagging, and pronunciation prediction to build a large dictionary.
著者
清 雄一 大須賀 昭彦
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.5, pp.1377-1387, 2015-05-15

保有している個人に関する情報データベースを他事業者と共有する場合,プライバシへの配慮が必要である.l-多様性等の一般的な匿名化技術では,データベースから個人を特定できる識別子を除外し,擬似識別子(QID)を一般化することで,攻撃者が各個人の属性値を推定することを防ぐ.通常,匿名化は一度のみ行われ,匿名化されたデータベースが複数のデータ利用者に共有され得る.したがって,あるデータ利用者が特に分析を行いたいQIDが完全に一般化されてしまい,まったく分析ができなくなってしまう可能性がある.本研究では,QIDを一般化せず,センシティブ属性にダミーの要素を追加することで,l-多様性を実現する.したがって各データ利用者は,好きなQIDに基づいて自由に分析を行うことが可能となる.提案手法が,既存のl-多様性に関する手法と比べてプライバシと有効性について高いトレードオフを取れることを,実データを用いたシミュレーションによって示す.
著者
グエン ミン テイ 川村 隆浩 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.12, pp.2970-2978, 2013-12-01

本論文は,実世界での人々の行動を分析し,状況に応じた適切な情報提示などへ役立てることを目的に,Twitterなどソーシャルメディアから行動ネットワークを構築する研究の一環である.ソーシャルメディアからの行動抽出にあたっては,さまざまな理由から呟かれなかった行動が数多く存在し,結果として行動ネットワークがスパースになってしまうという問題が存在する.そこで,行動の性質とユーザのゴールを考慮した行動ベース協調フィルタリング手法を提案し,欠損行動の推測を試みる.また,協調フィルタリングによる頻度の原理の副作用としての低頻度だが価値のある情報が埋もれてしまう問題に対して,人が成功している人や行動にどのように影響を受けるか,を単純にモデル化し,一定の重み付けを行う方法を提案する.そして,東日本大震災発生時のtweet 337,958件を対象に評価実験を行った結果,提案手法を用いることで行動ネットワーク内の欠損行動ノードを一定程度,補完できることを確認した.
著者
岩崎 祐貴 折原 良平 清 雄一 中川 博之 田原 康之 大須賀 昭彦
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

近年,ブログやtwitterなどソーシャルメディアの普及により誰でも気軽に情報発信できるようになった.それに伴い頻繁に炎上が起こり,ブログの閉鎖や個人情報の特定といった被害に合うリスクが高まっている.そこで本研究では,実際に炎上したtwitterやブログ記事を収集,分析することで炎上の原因を調査した.また,今後の炎上を防ぐため,過去の炎上事例を教師データとした機械学習の適用方法を提示する
著者
全 泰賢 川村 隆浩 中川 博之 田原 康之 大須賀 昭彦
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.11, pp.2485-2493, 2012-11-15

近年,商品やサービスを販売するECサイトの市場規模がますます拡大している.しかし,多くのECサイトの商品検索機能はカテゴリ絞り込みやキーワード検索に限られており,単語での特徴指定が困難な商品の検索においては難がある.たとえば,ECサイトの中でも特に売上げが伸びている服飾系の商品においては,ユーザは事前にブランド名やデザイン種別などの商品知識を頭に入れる必要があり,それによって商品群を絞り込んだ後にも何十というサムネイル画像を順番に見ていかなければならない.そこで本研究では,ユーザが閲覧した衣服(デザイン)の履歴を,商品画像の局所特徴量と商品説明文中のキーワードから,我々が事前に用意した服飾オントロジ上にマッピングする.そして,オントロジ内の距離計算によってユーザのデザインに関する嗜好を推定し,ユーザ嗜好に沿った衣服を抽出・推薦するエージェントシステムを提案する.また,推薦精度に関する評価実験を行い,70%超の再現率を達成していることを確認した.E-commerce market has been expanding, recently. However, search functionality for products in most of e-commerce sites are limited to keyword search and category selection, thus there is a problem to search for the product, to which it is difficult to specify its characteristics by words. In terms of a fashion product whose sales have been increasing year after year, users are required to learn the keywords like brand names and design terms in advance, and after just narrowing a list of the products they need to check small thumbnail images of enormous items one by one. Therefore, we propose an 'agent' service, which maps the user's browsing history of the product designs to the prepared fashion ontology based on local features of product images and keywords in product descriptions. Then, it estimates his/her favorite designs by calculating distances in the ontology and recommends the unseen items to the user. Also, we conducted an experiment for the recommendation accuracy, and confirmed more than 70% of recall.
著者
橋本 和幸 中川 博之 田原 康之 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.11, pp.1762-1772, 2011-11-01
被引用文献数
1 or 0

近年,政策やサービスなどの評判を調査するためにアンケート形式による調査が増加しているが,回収率が低落傾向にあることや,人的コストが増加するなどの問題が生じている.一方,Web上にはユーザの意見を含む評価情報が多数存在している.そこで本研究では,評判傾向予測システムの構築を目的として評判傾向の時間的変化とその原因をマイクロブログから抽出する評判傾向抽出エージェントの実現を目指す.特に本論文では,評判傾向の抽出と評判傾向が変化した原因の抽出に注力する.評価情報の感情を抽出するセンチメント分析に着目し,回帰式から評判傾向の変化点を抽出した後に,変化点におけるトピックをチャンキングにより抽出する手法を提案する.本手法は,従来の評価判定法であるp/n判定にセンチメント分析を組み合わせることで,p/n判定単体よりも人手による調査と相関の高い時系列変化を抽出できる点が特徴であり,政治及びテレビドラマに関するコンテンツを対象に実際の支持率,視聴率に対する評価実験を実施した結果,政治(自由度調整済決定係数R'^2(p/n判定単体:0.22,提案手法:0.60)),テレビドラマ(自由度調整済決定係数R'^2(p/n判定単体:0.26,提案手法:0.56))ともに相関の高い時系列変化を抽出できることが確認できた.
著者
沈 偉 川村 隆浩 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.108, no.119, pp.7-14, 2008-06-23
被引用文献数
1 or 0

近年,Webに関する研究において,オントロジーの利用が盛んに進められている.しかし,オントロジーは構築の難しさが指摘され,構築するコストが問題視されている.そこで,本研究では一般ユーザを対象として,集合知としてオントロジーを構築するためのサイト,オントロジーWikiを提案する.
著者
高増 広大 田原 康之 清 雄一 大須賀 昭彦
雑誌
研究報告ソフトウェア工学(SE) (ISSN:21888825)
巻号頁・発行日
vol.2016-SE-191, no.2, pp.1-8, 2016-03-07

近年,スマートフォンの普及率が世界的に増加しているのに付随してスマートフォンアプリケーションの需要が高まっており,開発が進められてきている.そのため同じ課題を解決できるアプリケーション,すなわち類似したアプリケーションが多数出現している.そこでユーザはアプリケーションを利用して目的を満たす事は最低限の条件として,アプリケーションのコンテンツや使い易さ等,自分がこだわる観点でのアプリケーションの選定を行いたくなると考えられるが,多数の中からの選定は困難である.本研究では,ユーザが目的を達成する為にアプリケーションを導入するという前提で,ユーザのこだわりを考慮した推薦システムを提案する.そのために,通常アプリケーションの入手先となるアプリストアに投稿された他のユーザのレビューコメントに自然言語処理手法を適用する.具体的には,コメントから類似アプリケーションの特徴を表すと考えられる単語を抽出し,ユーザはそこから興味を持った単語を選ぶ.アプリケーションのレビューコメントにおいて単語の評価がネガティブかポジティブかを判定することにより,アプリケーションのその単語に関する評価値を算出し,ランク付けして推薦する.算出した評価値を,実際にアプリを使用した被験者による評価と比較し,またレビュー内に出現する単語に対するネガティブ・ポジティブの判定を,人手で作成した正解データと照らし合わせる事でシステムの評価を行った.
著者
清 雄一 竹之内 隆夫 大須賀 昭彦
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.10, pp.1977-1987, 2015-10-15

データを外部のストレージ事業者に預けることが多くなっているが,プライバシや機密情報管理の観点から問題が生じる場合がある.データおよびその索引を暗号化する手法が有効であるが,検索等,データ処理の効率性を低下させることは避けたい.このような課題に対し,Bloom Filterというデータ構造を用いる情報管理エージェントが提案されている.しかし,安全性を担保するためには,検索速度が悪化するという問題がある.これは検索時にクラウド上のデータ数に比例した回数だけハッシュ値を計算する必要が生じるためである.提案手法では,Bloom Filterを利用し,ハッシュ値の計算のみではなく,素数によるMOD演算を併用することで,これまでと同レベルの安全性を保持したうえで検索速度を向上させる.793万ドキュメントを利用したシミュレーション評価により,従来約30.2秒必要だった検索が0.7秒程度でできることを示す.
著者
芦川 将之 川村 隆浩 大須賀 昭彦
出版者
The Japanese Society for Artificial Intelligence
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.6, pp.503-515, 2014

Open Crowdsourcing platforms like Amazon Mechanical Turk provide an attractive solution for process of high volume tasks with low costs. However problems of quality control is still of major interest. In this paper, we design a private crowdsourcing system, where we can devise methods for the quality control. For the quality control, we introduce four worker selection methods, each of which we call preprocessing filtering, real-time filtering, post processing filtering, and guess processing filtering. These methods include a novel approach, which utilizes a collaborative filtering technique in addition to a basic approach of initial training or gold standard data. For an use case, we have built a very large dictionary, which is necessary for Large Vocabulary Continuous Speech Recognition and Text-to-Speech. We show how the system yields high quality results for some difficult tasks of word extraction, part-of-speech tagging, and pronunciation prediction to build a large dictionary.
著者
中谷 多哉子 羽生田 栄一 黒川 利明 直田 繁樹 大須賀 昭彦 児玉 公信 増村 均 中村 正規 田中 立二
出版者
The Institute of Electrical Engineers of Japan
雑誌
電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society (ISSN:03854221)
巻号頁・発行日
vol.123, no.4, pp.640-648, 2003-04-01
被引用文献数
1 or 0

Object-oriented technology is used for the software of the large range, and its application fields are increasing. Object-oriented technology is also accepted naturally in the field of Internet application. Consequently, developments of new kinds of object-oriented technologies have been performed. Agent technology has been developed based on an object-oriented concept, and may have a great evolution with applying to applications of Internet field. In this paper, authors introduce the latest trend and the example of application of such object-oriented technology and agent technology.
著者
グエン ミン テイ 川村 隆浩 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.12, pp.2970-2978, 2013-12-01

本論文は,実世界での人々の行動を分析し,状況に応じた適切な情報提示などへ役立てることを目的に,Twitterなどソーシャルメディアから行動ネットワークを構築する研究の一環である.ソーシャルメディアからの行動抽出にあたっては,さまざまな理由から呟かれなかった行動が数多く存在し,結果として行動ネットワークがスパースになってしまうという問題が存在する.そこで,行動の性質とユーザのゴールを考慮した行動ベース協調フィルタリング手法を提案し,欠損行動の推測を試みる.また,協調フィルタリングによる頻度の原理の副作用としての低頻度だが価値のある情報が埋もれてしまう問題に対して,人が成功している人や行動にどのように影響を受けるか,を単純にモデル化し,一定の重み付けを行う方法を提案する.そして,東日本大震災発生時のtweet 337,958件を対象に評価実験を行った結果,提案手法を用いることで行動ネットワーク内の欠損行動ノードを一定程度,補完できることを確認した.