著者
荒牧 英治 増川 佐知子 森田 瑞樹
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2011-NL-201, no.1, pp.1-8, 2011-05-09

近年のTwitterの普及とともに,そこから有益な情報を抽出する研究の需要が高まっている.本研究ではインフルエンザ流行予測の問題に焦点をあてる.まず,Twitterからインフルエンザに関連した発言を抽出する.次に,SVMを用いた分類器で,その発言者が実際にインフルエンザにかかっているかどうかを判定する.実験では,厚労省報告の症例数と比較し相関係数0.89の精度で流行予測することができ,提案手法の有効性を示した.特に,流行の開始時期においては,相関係数は0.97と高く,最先端の手法であるGoogle Fluトレンドと同等の精度が得られた.本研究によって,Twitter上のテキストが現実の疾病状態を反映していること,また,言語処理技術によって,その情報が抽出可能であることを示した.
著者
原口 和貴 大塚 真吾 荒牧 英治 若宮 翔子 灘本 明代
雑誌
研究報告データベースシステム(DBS) (ISSN:2188871X)
巻号頁・発行日
vol.2019-DBS-169, no.6, pp.1-6, 2019-09-03

これまで我々は一つのニュース記事から漫才台本を自動生成する手法を提案してきた.本論文ではヘッドラインニュースを構成する複数のニュース記事から漫才台本を自動生成する手法の提案をする.ニュース記事を漫才台本にする際,ネガティブなニュース記事を漫才にすることは不適切である.そこで本論文ではヘッドラインニュースの中からポジティブ/ニュートラルのニュース記事を抽出しこれら複数のニュース記事から一つの漫才台本を自動生成する手法の提案をする.
著者
荒牧 英治
出版者
東京大学
雑誌
若手研究(A)
巻号頁・発行日
2008

電子カルテが急速に普及しつつある現在,電子カルテ文章からの情報抽出技術が待ち望まれている.しかし,カルテ文章は自然言語で記述されるため,現状では扱いが困難である.本プロジェクトでは,カルテに特化した情報抽出システムの開発を目指す.また,同時に研究利用可能な模擬カルテデータの構築も行い,研究材料として利用可能にする.
著者
岡 瑞起 李 明喜 橋本 康弘 宇野 良子 荒牧 英治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

我々は、見た目に特別な意匠はなくても人間や社会のプロセスに良い変化をもたらす提案を「デザイン」と定義し、実践を通じた情報技術を活用したデザインプロセスの形式化に関する研究に取り組んでいる。実践として「Augmented Campus:拡張するキャンパス」というテーマのもと、キャンパスをより活性化するための環境をデザインすることを目的としたワークショップを行った。その取り組みについて紹介する。
著者
荒牧 英治 四方 朱子 冨井 美子 矢島 弘士
出版者
一般社団法人 日本医療情報学会
雑誌
医療情報学 (ISSN:02898055)
巻号頁・発行日
vol.36, no.1, pp.17-23, 2016 (Released:2017-05-08)
参考文献数
13
被引用文献数
1

【背景】近年,多くの患者がSNSに参加し,彼らの体験を共有し,互いにサポートできる効果を期待しているが,その効果の検証は十分になされていない.本研究では,SNS参加者のうち,一定の利用がある患者とない患者について,QOLの変化を2時点に渡って調査し,積極的なSNS活動によって,QOLが好転するかどうかを調査した.【材料】LifePalette参加者27名について,積極的な活動を行うエキスパート患者(7名)と,行わない一般患者(20名)について,2014年7月と2015年3月の2点でSF36v2によるQOLの調査を行った.【結果】初回において,エキスパート患者は一般患者より社会的QOLが有意に低かった(p=0.04).2回目の調査では,一般患者の社会的QOLは有意に低下し(p=0.05),逆に,エキスパート患者の社会的QOLは有意でないものの僅かに上昇し,実験終了時には,一般患者とエキスパート患者の社会的QOLの有意差がなくなった.【考察】社会的QOLが低いユーザがエキスパート患者となっており,SNSに登録していても,活動を行わない場合,社会的QOLは低下する.これにより,SNSに入ったならば,SNS活動に積極的に参加することが,QOL低下を防ぐ一助となる可能性が示唆された.
著者
荒牧 英治 若宮 翔子 矢野 憲 永井 宥之 岡久 太郎 伊藤 薫
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.1, pp.119-152, 2018-02-15 (Released:2018-05-15)
参考文献数
15
被引用文献数
3 9

高度な人工知能研究のためには,その材料となるデータが必須となる.医療,特に臨床に関わる分野において,人工知能研究の材料となるデータは主に自然言語文を含む電子カルテである.このようなデータを最大限に利用するには,自然言語処理による情報抽出が必須であり,同時に,情報抽出技術を開発するためのコーパスが必要となる.本コーパスの特徴は,45,000 テキストという我々の知る限りもっとも大規模なデータを構築した点と,単に用語のアノテーションや用語の標準化を行っただけでなく,当該の疾患が実際に患者に生じたかどうかという事実性をアノテーションした点の 2 点である.本稿では病名や症状のアノテーションを対象に,この医療コーパス開発についてその詳細を述べる.人工知能研究のための医療コーパス開発について病名や症状のアノテーションを中心にその詳細を述べる.本稿の構成は以下の通りである.まず,アノテーションの基準について,例を交えながら,概念の定義について述べる.次に,実際にアノテーターが作業した際の一致率などの指標を算出し,アノテーションのフィージビリティについて述べる.最後に,構築したコーパスを用いた病名抽出システムについて報告する.本稿のアノテーション仕様は,様々な医療テキストや医療表現をアノテーションする際の参考となるであろう.
著者
叶内 晨 北川 善彬 荒牧 英治 岡崎 直観 小町 守
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.22, no.5, pp.363-395, 2015-12-14 (Released:2016-03-14)
参考文献数
49

ソーシャルメディアサービスの普及により,人々や社会の状況を調査する新しいアプローチが開拓された.ひとつの応用事例として,ソーシャルメディアの投稿から疾患・症状の流行を検出する公衆衛生サーベイランスがある.本研究では,自然言語処理技術を応用して,ソーシャルメディアの投稿から風邪やインフルエンザなどの罹患を検出するタスクに取り組んだ.最先端のシステムのエラー分析を通じて,事実性解析と主体解析という重要かつ一般性のあるサブタスクを見い出した.本研究では,これらのサブタスクへの取り組みを行い,罹患検出タスクへの貢献を実証した.
著者
山下 直美 葛岡 英明 平田 圭二 工藤 喬 荒牧 英治 服部 一樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.5, pp.981-993, 2017-05-15

本論文では,2つの調査に基づいて,うつ病患者の家族介護者を支援するための知見を述べる.1つ目の調査では,患者の気分の上下や予期せぬ振舞いなどに対処する家族介護者の介護活動の現状とニーズを把握する.その調査結果をふまえて介護記録Webアプリケーション「みまもメイト」を開発する.2つ目の調査では,家族介護者がみまもメイトを6週間にわたって利用することによって,家族介護者のうつ病患者に対する関わり方や患者との人間関係がどのような影響を受けたかを調べる.利用後のインタビュー調査から,家族介護者がみまもメイトを利用することによって,自身の介護活動を客観的に見つめ直す効果がある(第三者視点の導入)ことが分かった.さらに興味深いことに,みまもメイトは患者,病気,家族介護者の間の関係を変化させ,これによって,家族介護者とうつ病患者間のコミュニケーションを改善する効果があることも分かった.具体的には,みまもメイトを用いることによって,家族介護者単独で病気をかかえる患者に対処するという構図(家族介護者vs.患者+病気)から,患者と家族介護者が協調しながら病気に立ち向かうという構図(家族介護者+患者vs.病気)へと変化した.
著者
荒牧 英治 増川 佐知子 森田 瑞樹
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 = Journal of natural language processing (ISSN:13407619)
巻号頁・発行日
vol.19, no.5, pp.419-435, 2012-12-14
参考文献数
23
被引用文献数
1

近年,ウェブの情報を用いて,感染症などの疾病状態を監視するシステムに注目が集まっている.本研究では,ソーシャルメディアを用いたインフルエンザ・サーベイランスに注目する. これまでの多くのシステムは,単純な単語の頻度情報をもとに患者の状態を調査するというものであった.しかし,この方法では,実際に疾患にかかっていない場合の発言を収集してしまう恐れがある.また,そもそも,医療者でない個人の自発的な発言の集計が,必ずしもインフルエンザの流行と一致するとは限らない.本研究では,前者の問題に対応するため, 発言者が実際にインフルエンザにかかっているもののみを抽出し集計を行う.後者の問題に対して,発言と流行の時間的なずれを吸収するための感染症モデルを提案する.実験においては,Twitter の発言を材料にしたインフルエンザ流行の推定値は,感染症情報センターの患者数と相関係数 0.910 という高い相関を示し,その有効性を示した.本研究により,ソーシャルメディア上の情報をそのまま用いるのではなく,文章分類や疾患モデルと組み合わせて用いることで,さらに精度を向上できることが示された.
著者
簗瀬 拓弥 増田 英孝 山田 剛一 荒牧 英治 中川 裕志
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013-IFAT-110, no.1, pp.1-6, 2013-02-21

本研究では電車の運行状況をリアルタイムに一般の Twitter のユーザのツイートから取得することを目的とする.対象として常磐線をキーワードとして含むパブリックタイムライン上のツイートを半年分収集した.このデータを用いて単位時間あたりのバースト数を元に定常時と異常時を判別し,通知を行うシステムを試作した.また,遅延や運転見合わせ時のユーザのツイートの特徴の分析を行った.
著者
若宮 翔子 ヤトフト アダム 河合 由起子 秋山 豊和 荒牧 英治
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.3, pp.14-24, 2016-09-30

Twitterに代表されるソーシャルメディアはイベント検出で頻繁に活用されている.このようなシステムでは,ツイートを特定の時間や位置に割り当てるために,タイムスタンプ(日時)やロケーションスタンプ(緯度経度)などのメタデータが重要な役割を果たしている.一方で,コンテンツに書かれたテキスト文中の時間や位置に関する表現は曖昧な場合があり,メタデータよりも信頼性が落ちることから,十分な活用が困難であった.このため,我々はメタデータと時空間表現の差異分析を可能とする,大規模ソーシャルメディアデータの可視化システムを開発している.本稿では,特に空間に対する群衆の関心を分析するため,ツイートの発信位置(メタデータ)とコンテンツテキスト中の位置表現の差異を可視化するシステムを提案する.実験では,約3カ月分の米国で発信されたツイートを用いて3種類のデータビューを構築し,空間的な尺度に基づき群衆の空間的関心に関する分析結果の例を示して考察する.提案したフレームワークや考察は,ソーシャルメディアデータの地理的・社会的な側面に関心を持つユーザにとって有用であると考えられ,また,将来的に,テキストの位置情報を用いたメタデータの補完に有用であると期待される.
著者
荒牧 英治 岡崎 直観
雑誌
情報処理
巻号頁・発行日
vol.57, no.1, pp.32-33, 2015-12-15

2000年以降の自然言語処理(NLP)の発展の一翼を担ったのはWorld Wide Web(WWW)である.Webを大規模テキストコーパスと見なし,そこから知識や統計量を抽出することで,さまざまなタスクで精度の向上が報告されている.これらは,WebがNLPを高度化した事例と言える.本プロジェクトでは,Webのテキストデータから個人の実際の経験や意図を推測する(マーケティングでは,「傾聴」という言葉が用いられている)というタスクにおいて,自然言語処理の最先端技術の適用と,そのエラーの分析,取り組むべき課題の整理を行った.
著者
宮部 真衣 荒牧 英治 三浦 麻子
雑誌
研究報告マルチメディア通信と分散処理(DPS)
巻号頁・発行日
vol.2011, no.17, pp.1-7, 2011-09-08
被引用文献数
2

2011 年 3 月 11 日に発生した東日本大震災においては,Twitter に多くのメッセージが投稿された.これまで,緊急時におけるマイクロブログの有用性が示されているものの,地域を考慮したマイクロブログの利用傾向に関する分析は十分に行われていない.本研究では,マイクロブログとして Twitter に着目し,東日本大震災発生後に Twitter へと投稿されたツイートを分析した.分析の結果,以下の知見を得た.(1) 被害の大きかった地域では直接的なメッセージのやり取りが行われる傾向がある.一方,被害の小さかった地域では,ツイートされた情報が拡散される傾向が高い.(2) 特に被害の大きい地域で発信された情報については,他地域へと移動する傾向が見られた.After the Great Eastern Japan Earthquake in Japan 2011, numerous tweets were exchanged on Twitter. Several studies have already pointed out that micro-blogging systems have shown potential advantages in emergency situations, but it remains unclear how people use them. This paper presents a case study of how people used Twitter after the Great Eastern Japan Earthquake. First, we gathered tweets immediately after the earthquake and analyzed various factors, including locations. The results revealed two findings: (1) people in the disaster area tend to directly communicate with each other. On the other hand, people in the other area prefer tend to rely on re-tweet; (2) information posted from the disaster area tends to spread in the other area.
著者
荒牧 英治 久保 圭 四方 朱子
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2014-DBS-159, no.23, pp.1-6, 2014-07-25

言語能力は人生における経験の結晶であり,加齢によって損なわれることがないとされる.しかし,その一方で,文法能力など,一部の能力の加齢による低下が示されることもある.このように,老化と言語能力の関係については不明な点が多い.この原因は,次の 2 つによるところが大きい.まず,研究対象である高齢者から大規模なデータを得るのが困難であること.次に,言語はさまざまな能力の総体であり,調査ごとに測っている言語能力が異なることである.そこで,本研究では,Web 上の文章を利用する.まず,50 代から 80 代の高齢者や小中学生,第二言語習得者,認知症患者のブログや作文を集めた.また,測定に関しては,語彙に関するものや構文に関するものなど,さまざまな指標を用いた.この結果,高齢者は,使う言葉の種類が減る可能性があること,さらに,難易度の高い言葉から使用頻度が減ることが明らかになった.この知見を応用することによって,老化や認知症の早期発見の可能性があり,今後の応用が期待される.
著者
粟村誉 荒牧英治 河原大輔 柴田知秀 黒橋禎夫
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014, no.14, pp.1-8, 2014-06-26

近年,膨大な量の文書が Web 上に溢れるようになるにつれ,それらから有用な情報を抽出する技術が重要になってきた.特に,Twitter などのソーシャルネットワークサービス (SNS) は地域固有の情報を含むことが多いため,文書内の地名表現がどこの地名,地域を指しているかを同定することが必要となる.これまで,このような地名曖昧性解消の問題は,語義曖昧性解消の手法を利用して,語彙情報に基づいて解かれることが多く,地名特有の手がかりが使われていない.本研究では,(1) 空間的近接性と (2) 時間的一貫性の 2 つの手がかりを用いて,地名曖昧性解消の精度向上を目指す.空間的近接性は,投稿内の地名同士は距離が近いことが多いという傾向,時間的一貫性は,一連の投稿に現れる地名はそれぞれ関連性があるという傾向をとらえるために導入する.位置情報付きツイートを用いた実験によって,2つの手がかりの有効性を確認した.
著者
宮部 真衣 灘本 明代 荒牧 英治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.1, pp.563-573, 2014-01-15

近年,マイクロブログの普及にともない,マイクロブログを用いた個人での情報発信が増加している.2011年3月11日に発生した東日本大震災においては,Twitterに多くの情報が投稿された.Twitterでは,重要な情報が伝搬された一方で,様々な流言の拡散も多数行われた.特に災害時は,流言が救援活動などに悪影響を及ぼす可能性が高いため,流言の広がりにくい環境を作る必要がある.本研究では,マイクロブログ上の流言に対して,どのような対応がされているかを調査した.また,人間によって発信される訂正情報に着目し,訂正情報に基づいて流言情報を収集・提供することにより流言拡散を防止するサービスを構築した.本提案手法では,流言であることを指摘する表現(流言マーカ)を含む情報を収集し,それらが訂正情報であるかどうかを判定する.平常時のツイート,災害時のツイートを用いて,構築した訂正情報分類器の判定精度を検証した結果,平常時を含めたデータを用いることで,平常時・災害時のどちらでも高精度な判定が期待できることを示した.Recently, conveying information from individuals has increased due to the development of microblog. After the Great Eastern Japan Earthquake in Japan 2011, numerous tweets were exchanged on Twitter. Twitter provided a lot of important information after the earthquake. On the other hand, various false rumors were spread on Twitter. False rumors negatively affect important activities such as relief activities. Therefore, it is required to structure the environment that prevents people from spreading false-rumors. In this paper, we analyze how people deal with false rumors on Twitter. Moreover, we propose rumor information cloud based on rumor-correction information. The proposed method collects information including indication of rumor, then classifies the information into correct information or other information. On the basis of these evaluation experiments, the method using data of nonemergency situation can classify both data of an emergency and a nonemergency situation with high accuracy.