著者
石先 広海 Herring Susan C. 服部 元 小野 智弘 滝嶋 康弘
出版者
FIT(電子情報通信学会・情報処理学会)運営委員会
雑誌
情報科学技術フォーラム講演論文集
巻号頁・発行日
vol.12, no.3, pp.47-52, 2013-08-20

We analyze user behavior on SoundCloud.com, a web-based music distribution site, using the methodology of computer-mediated discourse analysis. The broad goal is to infer patterns of use that can inform the development of methods to facilitate communication among online users. In order to achieve this goal, we analyze SoundCloud comments and identify site design features that facilitate users' actions, using speech act analysis and dynamic topic analysis. We address two research questions: What are the most common communicative acts on the music distribution site, and which commenting function of the site contributes most to facilitating interactive commenting? Results of speech act analysis show that 56% of comments are REACT which means site users mostly react to the song in short, simple comments. Additionally the users tend to be more interactive when using the timed comment function, which appear below the song waveform, provided by the site. Dynamic topic analysis reveals that the structure of regular comments, made on the song as a whole, shows prompt focused such as blog comment, and structure of timed comments shows sequential threads are more interactive as is the case in chatting. These findings indicate that comments which focus on particular part of the song have possibility to facilitate user's interactive comments.
著者
池田 和史 柳原 正 服部 元 松本 一則 小野 智弘
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.39, pp.1-8, 2010-11-05

評判解析や文書の要約、検索などを高精度に行うために、係り受け解析や格解析が用いられるが、ブログや電子掲示板上の文書を対象とする場合、口語的な記述が多数見られるため、十分な解析精度が得られないことが課題となる。本稿では、口語的な記述に頻繁に見られる助詞落ち表現が解析精度低下の原因の1つであることに着目し、助詞落ちを自動的に推定し、欠落した助詞を補完することで解析精度を向上する手法を提案する。提案手法では、新聞などの助詞落ちの少ない正規の文書から意図的に助詞落ちを発生させた文書を正例、助詞落ちを発生させていない文書を負例として識別器を学習させ、解析対象である口語文書の助詞落ち箇所を推定する。加えて、推定した助詞落ち箇所の前後の単語をキーとして新聞文書を検索することで、適切な助詞を自動的に補完する。性能評価実験では、Webから収集したブログ文書に対して、人手により助詞落ち箇所と補完すべき助詞を付与し、提案手法における助詞落ち推定精度および補完精度の評価を行った。加えて、助詞を補完することによる係り受け解析精度の向上についても評価した。In this paper, we propose algorithms for reducing the errors of the dependency analysis on colloquial style sentences by complementing the omission of postpositions which makes dependency analysis errors. In our algorithms, the omission of postpositions is detected by a classifier which is trained by the features extracted from formally written documents such as newspaper sentences. As positive examples of the classifier, we automatically omit the postpositions from newspaper sentences, and as negative examples, we used the newspaper sentences as they are. After estimating the omission of the postpositions, complementation candidates of the omitted postpositions are automatically retrieved from newspapers. In the experimental evaluations, we collect blog documents which contain colloquial style sentences and manually labeled the omitted postpositions on them. We evaluated the estimation accuracy, complementation accuracy, and improvement of the dependency analysis accuracy.
著者
服部 元 武吉 朋也 小野 智弘 滝嶋 康弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.109, no.390, pp.13-18, 2010-01-18
被引用文献数
1

本研究では,特定のテーマに関連するノウハウ情報を効率的に収集する「ノウハウ検索」手法を提案する.既存の検索エンジンにおいては,一般的に大量の検索結果が得られる.ここで,クエリが「富士山の標高」のような,検索結果上位の数文書程度を閲覧すれば十分な回答が得られるタイプの検索であれば,問題はない.一方,クエリが「おいしいカレーの作り方」のような多様なノウハウの収集を目的とするタイプの検索の場合は,なるべく多くのWeb文書を閲覧する必要があり,検索結果を順次閲覧する方法では,時間や労力の点で限界がある.本稿では,なるべく少ない閲覧数でより多くのノウハウを集める効率的な情報収集の手法を提案する.具体的には,単語の概念関係と出現頻度を利用してノウハウに関連する単語をWeb文書から抽出し,未読のノウハウ情報を含むWeb文書を優先的にユーザに提示する.評価実験を行い,単語の概念関係を導入することでノウハウに関連する単語を多く抽出できること,および,未読のノウハウ情報を優先的に提示することで,一般の検索結果を閲覧するよりも効率的にノウハウ情報を閲覧できることを示した.
著者
池田 和史 服部 元 松本 一則 小野 智弘 東野 輝夫
出版者
情報処理学会
雑誌
情報処理学会論文誌コンシューマ・デバイス&システム(CDS) (ISSN:21865728)
巻号頁・発行日
vol.2, no.1, pp.82-93, 2012-03-21
被引用文献数
1

近年,TwitterのようなブログやWeb掲示板などに投稿された商品やテレビ番組などに対する口コミ情報を分析してマーケティングなどに応用する評判解析技術に注目が集まっている.これらは手軽に情報発信することが可能なため,新鮮かつ多数の意見を即座に収集するツールとして,その活用は大きな可能性を持っている.一方で,評判は投稿者の年齢や性別,趣味などのプロフィールに応じて異なることが多いが,ブログや掲示板には投稿者の年齢や性別が記載されていない場合が多く,投稿数や平均的な意見などの表面的な情報しか抽出できず,プロフィールごとの意見を抽出できないことが課題であった.この問題を解決するため,著者らはTwitter上の口コミ投稿者の日常的な投稿内容を解析することで,年代,性別,居住地域などのプロフィールを推定する技術を開発した.本技術を利用することで,ネット上の口コミ情報をプロフィールごとに分類,集約することが可能となり,商品の改善やテレビ番組の企画などに生かすことが可能となる.性能評価実験の結果,提案手法の汎用的な推定精度は性別で88.0%,年代で68.0%,居住地域で70.8%であり,視聴率測定などへの応用を想定したプロフィール分布誤差の評価では,分布に偏りがある場合でも性別で8.8%,年代で12.4%,居住地で14.0%と実利用に十分な精度であることが示された.This paper proposes a real-time analysis technology of the online opinions of commercial products and broadcast TV programs. As many people submit their opinions via social media services, such as Twitter, utilizing these real-time and huge amounts of opinions is strongly desired as a novel marketing tool. However, it is impossible in many cases to understand the overall trend of such enormous user opinions by browsing the information stream on the screen. In addition, though presuming the ratio of positive and negative opinions is useful, that discrimination is not much enough because the ratio of opinions differs depending on user demographics (age, sex, area, etc.) The proposed technology makes it possible to analyze the contents of Twitter streams related to commercial products or broadcast TV programs, and estimate the demographics of the users by tracking and analyzing their past tweets. This analysis attracts peoples such as, product planners, broadcast TV directors, and advertisement agencies that produce and promote products/TV programs for target segments. Our experimental results show that the estimation accuracy of the proposed algorithms is, 88.0% in sex, 68.0% in age, 70.8% in areas, respectively. The error ratio in the distribution of estimated demographics was 8.8% in sex, 12.4% in age, 14.0% in area, respectively, which is high enough for practical use.
著者
鈴木 雅実 服部 元 小野 智弘
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

テキスト(言葉)を主体とするコミュニケーションについては,情報量を多くしたからと言って感動がより大きく伝わるとは限らず,説明過多の場合はむしろ逆効果であったりする。それとは対極的に,言葉を凝縮した短詩や名言などを通じて人と感動を共有する日本の文化的な特徴は見直されてよい。このような意思伝達と共感のスタイルをコンサイス・コミュニケーションと呼ぶことにして,その近未来的な支援のあり方について考察する。
著者
池田和史 服部元 松本一則 小野智弘 東野輝夫
雑誌
マルチメディア、分散協調とモバイルシンポジウム2011論文集
巻号頁・発行日
vol.2011, pp.1308-1315, 2011-06-30

近年、TwitterのようなブログやWeb掲示板などに投稿された商品やテレビ番組などに対する口コミ情報を分析してマーケティング等に応用する評判解析技術に注目が集まっている。これらは手軽い情報発信が可能なため、新鮮かつ多数の意見を即座に収集するツールとして、その活用は大きな可能性を持っている。一方で、評判は投稿者の年齢や性別、趣味などのプロフィールに応じて異なることが多いが、ブログや掲示板には投稿者の年齢や性別が記載されていない場合が多く、投稿数や平均的な意見などの表面的な情報しか抽出できず、プロフィールごとの意見を抽出できないことが課題であった。この問題を解決するため、著者らはTwitter上の口コミ投稿者の日常的な投稿内容を解析することで、年代、性別、居住地域などのプロフィールを推定する技術を開発した。本技術を利用することで、ネット上の口コミ情報をプロフィールごとに分類、集約することが可能となり、商品の改善やテレビ番組の企画などに生かすことが可能となる。性能評価実験の結果、提案手法の汎用的な推定精度は性別で88.0%、年代で68.0%、居住地域で70.8%であり、視聴率測定などへの応用を想定したプロフィール分布誤差の評価では、分布に偏りがある場合でも性別で8.8%、年代で12.4%、居住地で14.0%と実利用に十分な精度であることが示された。
著者
池田 和史 柳原 正 服部 元 松本 一則 小野 智弘 滝嶋 康弘
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.8, pp.2474-2483, 2011-08-15

本稿では高速かつ高精度に有害サイトを検出するため, Webサイトの背景色やリンク先, ブラウザに特定の動作をさせるスクリプトなど, 有害サイトに特徴的に見られる傾向をHTML要素から検出する手法を提案する. 提案手法では有害サイトのHTMLに偏って出現するような文字列を自動的に抽出し, SVM(Support Vector Machine)を用いてこれらの特徴を組み合わせて有害サイトの検出を行う. 提案手法はWebサイトの本文の情報を利用しないため, 既存のキーワードベース方式によって検出が困難なサイトも検出が可能である. このため, 既存のキーワードベース方式と組み合わせて利用することで検出精度を向上させることも可能である. 大規模なWebサイトデータを用いた性能評価実験を行い, 既存のキーワードベース方式と比較して, 適合率を9.3ポイント向上するなどの性能向上を確認した.