著者
宮部 真衣 灘本 明代 荒牧 英治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.1, pp.563-573, 2014-01-15

近年,マイクロブログの普及にともない,マイクロブログを用いた個人での情報発信が増加している.2011年3月11日に発生した東日本大震災においては,Twitterに多くの情報が投稿された.Twitterでは,重要な情報が伝搬された一方で,様々な流言の拡散も多数行われた.特に災害時は,流言が救援活動などに悪影響を及ぼす可能性が高いため,流言の広がりにくい環境を作る必要がある.本研究では,マイクロブログ上の流言に対して,どのような対応がされているかを調査した.また,人間によって発信される訂正情報に着目し,訂正情報に基づいて流言情報を収集・提供することにより流言拡散を防止するサービスを構築した.本提案手法では,流言であることを指摘する表現(流言マーカ)を含む情報を収集し,それらが訂正情報であるかどうかを判定する.平常時のツイート,災害時のツイートを用いて,構築した訂正情報分類器の判定精度を検証した結果,平常時を含めたデータを用いることで,平常時・災害時のどちらでも高精度な判定が期待できることを示した.
著者
宮部 真衣 灘本 明代 荒牧 英治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.1, pp.563-573, 2014-01-15

近年,マイクロブログの普及にともない,マイクロブログを用いた個人での情報発信が増加している.2011年3月11日に発生した東日本大震災においては,Twitterに多くの情報が投稿された.Twitterでは,重要な情報が伝搬された一方で,様々な流言の拡散も多数行われた.特に災害時は,流言が救援活動などに悪影響を及ぼす可能性が高いため,流言の広がりにくい環境を作る必要がある.本研究では,マイクロブログ上の流言に対して,どのような対応がされているかを調査した.また,人間によって発信される訂正情報に着目し,訂正情報に基づいて流言情報を収集・提供することにより流言拡散を防止するサービスを構築した.本提案手法では,流言であることを指摘する表現(流言マーカ)を含む情報を収集し,それらが訂正情報であるかどうかを判定する.平常時のツイート,災害時のツイートを用いて,構築した訂正情報分類器の判定精度を検証した結果,平常時を含めたデータを用いることで,平常時・災害時のどちらでも高精度な判定が期待できることを示した.
著者
黒橋 禎夫 荒牧 英治
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.326-330, 2005
参考文献数
12

計算機パワーの増大と計算機ネットワークの発展に伴い, 電子テキストが遍在する時代となった。これに伴い, 人手で翻訳規則を与えるのではなく, 電子的対訳データに基づく統計翻訳, 用例ベース翻訳の研究開発が急速に進展している。これの現状, 差異を議論し, さらに, 機械翻訳の自動評価尺度, 評価型ワークショップなどについても説明する。
著者
荒牧 英治 増川 佐知子 森田 瑞樹
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 = Journal of natural language processing (ISSN:13407619)
巻号頁・発行日
vol.19, no.5, pp.419-435, 2012-12-14
被引用文献数
1

近年,ウェブの情報を用いて,感染症などの疾病状態を監視するシステムに注目が集まっている.本研究では,ソーシャルメディアを用いたインフルエンザ・サーベイランスに注目する. これまでの多くのシステムは,単純な単語の頻度情報をもとに患者の状態を調査するというものであった.しかし,この方法では,実際に疾患にかかっていない場合の発言を収集してしまう恐れがある.また,そもそも,医療者でない個人の自発的な発言の集計が,必ずしもインフルエンザの流行と一致するとは限らない.本研究では,前者の問題に対応するため, 発言者が実際にインフルエンザにかかっているもののみを抽出し集計を行う.後者の問題に対して,発言と流行の時間的なずれを吸収するための感染症モデルを提案する.実験においては,Twitter の発言を材料にしたインフルエンザ流行の推定値は,感染症情報センターの患者数と相関係数 0.910 という高い相関を示し,その有効性を示した.本研究により,ソーシャルメディア上の情報をそのまま用いるのではなく,文章分類や疾患モデルと組み合わせて用いることで,さらに精度を向上できることが示された.
著者
荒牧 英治
出版者
京都大学
雑誌
若手研究(A)
巻号頁・発行日
2011-04-01

近年,電子カルテやインターネットに接続可能な健康器具により大量の医療データが利用可能になりつつあり,これらを活用することで,過去例を見ない大規模な統計的研究や,大規模データに基づいた医療支援システムを実現可能であるとして大きな期待がよせられています. しかし,現状では,電子化された言語データを処理する枠組みがないため,データは活用されるどころか,情報過多を起こし現場の医療者の負担をさらに増しているケースさえあります.以上の背景のもと,本プロジェクトでは, カルテ文章に記述される疾患表現の表記ゆれを吸収する技術を開発します.