著者
大和田 裕亮 水野 淳太 岡崎 直観 乾 健太郎 石塚 満
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.20, no.3, pp.423-459, 2013-06-14 (Released:2013-09-14)
参考文献数
18
被引用文献数
1

東日本大震災では安否確認や被災者支援のためにTwitterが活躍したが,一方で多種多様な情報が流通し,混乱を招いた.我々は,情報の信憑性や重要性を評価するには,ツイート空間の論述的な構造を解析・可視化し,情報の「裏」を取ることが大切だと考えている.本稿では,ツイートの返信および非公式リツイート(以下,両者をまとめて返信と略す)に着目し,ツイート間の論述的な関係を認識する手法を提案する.具体的には,返信ツイートによって,投稿者の「同意」「反論」「疑問」などの態度が表明されると考え,これらの態度を推定する分類器を教師有り学習で構築する.評価実験では,返信ツイートで表明される態度の推定性能を報告する.さらに,本手法が直接的に返信関係のないツイート間の論述的な関係の推定にも応用できることを示し,ツイート間の含意関係認識に基づくアプローチとの比較を行う.
著者
鍋島 啓太 渡邉 研斗 水野 淳太 岡崎 直観 乾 健太郎
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.20, no.3, pp.461-484, 2013-06-14 (Released:2013-09-14)
参考文献数
14
被引用文献数
1

東日本大震災では,「コスモ石油の爆発で有害物質の雨が降る」などの誤情報の拡散が問題となった.本研究の目的は,東本日大震災後 1 週間の全ツイートから誤情報を網羅的に抽出し,誤情報の拡散と訂正の過程を分析することである.本稿では,誤情報を訂正する表現(以下,訂正パターン)に着目し,誤情報を認識する手法を提案する.具体的には,訂正パターンを人手で整備し,訂正パターンにマッチするツイートを抽出する.次に,収集したツイートを内容の類似性に基づいてクラスタリングし,最後に,その中から誤情報を過不足なく説明する1文を選択する.実験では,誤情報を人手でまとめたウェブサイトを正解データとして,評価を行った.また,誤情報とその訂正情報の拡散状況を,時系列で可視化するシステムを構築した.本システムにより,誤情報の出現・普及,訂正情報の出現・普及の過程を分析できる.
著者
水野 淳太 緒方 淳 後藤 真孝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.46, pp.31-38, 2008-05-15

本稿では,エピソードと呼ばれる音声ファイルの集合から成るポッドキャスト(音声ブログ)を対象とした,類似エピソードの検索手法について述べる.動画共有サイト等で,あるコンテンツの再生後に関連・類似したコンテンツを提示する機能を持つものが多いが,それらは書誌情報やタダユーザの視聴履歴に基づいている.本稿では,エピソードを音声認識した結果に基づいて,音声認識結果を confusion network に変換し,そこからエピソードを特徴づけるキーワードセットを抽出して,キーワードセット間の類似度を計算することで,関連エピソードを検索・提示できる手法を提案する.単語正解率や話者数など,傾向の異なるいくつかのエピソードに対して実験を行い,本手法がどのような場合に有効であるかについて評価を行った.本成果は,音声認識に基づくポッドキャスト検索サービス PodCastle で,関連エピソードを提示するためにも利用できる.Given podcasts (audio blogs) which are sets of speech files called episodes, this paper describes a method for retrieving similar episodes. Although video sharing services usualy have a function of showing a set of relevant /similar content after playing back a piece of content, they are based on bibliographic information, tags, and users' playback behaviours. In this paper, we propose a method that extracts keywords from confusion networks converted from speech recognition results and then retrieves and shows relevant episodes on the basis of similarity between those keywords. We evaluated this method using several episodes including a variety of speech recognition accuracy and the number of speakers. This result can be applied to show relevant episodes on PodCastle, a podcast search service based on speech recognition.
著者
水野 淳太 渡邉 陽太郎 エリックニコルズ 村上 浩司 乾 健太郎 松本 裕治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.12, pp.3408-3422, 2011-12-15

情報検索技術の発展により,あるトピックに関連する多様な情報を容易に入手できるようになった.しかしながら,これらの文書に記述されている情報には,不正確な記述,偏りのある意見などが多数混在している.そのため,個々の情報や意見の信憑性を判断するためには,多様な情報源からの意見との整合性を調べる必要がある.しかし,限られた時間で数多くの情報源を調べることは難しいため,ユーザが持っている先入観が正常な判断を妨げてしまう場合がある.我々は,そのような状態を避けるために,言論マップ生成課題に取り組んでいる.これは,検索された文について,まず,トピックに対する賛成意見であるのか,それとも反対意見であるのかを分類し,次に,賛成および反対する根拠を含むかどうかを認識し,それらを俯瞰的に示すというものである.本課題において最も重要な問題は,1組の文対が与えられたときに,その間の意味的関係を分類する文間関係認識である.これは近年さかんに研究されている含意関係認識と重なる部分が多い.しかしながら,ウェブ上の実文に対して既存の含意関係認識を適用しても,その分類性能は限定的であるという報告がある.そこで,我々は,評価用データセットとその分析に基づく文間関係認識モデルを構築した.本論文では,検索された文において,クエリの内容に対応する部分を正しく同定することが,最も重要な技術的課題であること,また,いくつかの制約を変化させることで,関係分類の精度と再現率を制御できることを示す.
著者
水野 淳太 後藤 淳 大竹 清敬 川田 拓也 鳥澤 健太郎 クロエツェー ジュリアン 田仲 正弘 橋本 力 奥村 明俊
雑誌
情報処理学会論文誌コンシューマ・デバイス&システム(CDS) (ISSN:21865728)
巻号頁・発行日
vol.6, no.1, pp.106-120, 2016-05-24

我々は,災害時にTwitterに投稿される膨大な情報を効率良く検索するために対災害SNS情報分析システムDISAANAを開発し,スマートフォンおよびPCで誰もが利用可能なWebアプリケーションとして試験公開している.本稿では,まず先行システムについて説明し,その問題点についてまとめる.次に,それらの問題をDISAANAがどのように解消するかを説明する.特に,不適切な回答候補の抽出を回避するために導入したモダリティ解析について詳述する.評価実験では,東日本大震災時のツイートに対して,人手で構築した192問の質問とその回答からなる評価セットを用いて本システムの評価を行った.評価の結果,先行システムに比べてF値が7ポイント改善した.エラー分析結果に基づいて,今後の改善方針について考察する.さらに,自治体で実施したDISAANAの有用性検証実験の結果についても報告する.
著者
水野 淳太 後藤 淳 大竹 清敬 川田 拓也 鳥澤 健太郎 クロエツェー ジュリアン 田仲 正弘 橋本 力 奥村 明俊
雑誌
研究報告コンシューマ・デバイス&システム(CDS) (ISSN:21888604)
巻号頁・発行日
vol.2015-CDS-14, no.14, pp.1-13, 2015-09-24

我々は,災害時に Twitter に投稿される膨大な情報を効率よく検索するために対災害 SNS 情報分析システム DISAANA を開発し,誰もが利用可能な Web アプリケーションとして試験公開している.本論文では,これまでに行ってきたシステムの改善ならびに不適切な回答候補を抽出する事を回避するために新たに導入したモダリティ解析,ツイート属性判定,予報表現抽出について議論する.その上で,これまで東日本大震災関連の災害情報のみで行われてきた本システムの評価を,台風や大雪といった一般的な災害にまで拡張し評価を行う.その結果,さらなる改善の余地が残されているものの,実用可能な性能に達していることを確認できた.
著者
佐々木 彬 水野 淳太 岡崎 直観 乾 健太郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

近年、Twitterなどのマイクロブログが爆発的に普及し、それを対象とした自然言語処理関連の研究が増加している。しかしながら、マイクロブログ上のテキストには口語表現やインターネットスラングの類が入り混じり、自然言語処理を行うに当たって不便な点が多い。本研究では機械学習により、マイクロブログ上のテキストから自然言語処理に適したテキストへの正規化を図る。