著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
杉山 弘晃 目黒 豊美 吉川 雄一郎 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

現在の雑談対話システムでは、雑談で観測される幅広い話題の間の連続性を正しく認識することが容易でないため、文脈とつながらない話題を発話し対話を破綻させてしまう問題がある。一方、ロボットを複数体化することで、ユーザ発話中の話題に対する応答義務が緩和されるため、話題の連続性に対する要求を低減させ、破綻を回避できると予想される。本研究では、このロボット複数体化による対話破綻回避効果について分析を行う。
著者
大和 淳司 大谷 淳 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2556-2563, 1993-12-25
被引用文献数
59

本論文では,画像によるモニタリングの自動化を目的として,動画像中の人物像の行動を認識する方法を提案している.実画像に対してもロバストな認識系を構築するために,幾何学的なモデルに基づくモデルフィッティングによらず,特徴量ベースのボトムアップな学習によるアプローチをとる.このために隠れマルコフモデル(HMM)を適用した時系列パターン認識を行った.HMMは音声認識で広く応用されているが,動画像への適用はほとんど例がない.本手法では,画像中の人物領域のメッシュ特徴をベクトル量子化によりシンボルに変換し,このシンボル列をHMMで学習,認識する.これにより,教師付き学習による,所与の動作カテゴリーの認識が実現できる.テニスの動作を列に,複数の被験者の動作認識実験を行い,90%以上の認識率を得た.また,不特定多数の人物動作認識を目的として,学習に用いなかった被験者を認識対象とした場合についても検討を行った.この場合,認識率の低下が起こるが,学習に用いる被験者数を増やすことにより認識率が向上することを確認した.
著者
徳永 弘子 武川 直樹 寺井 仁 湯浅 将英 大和 淳司
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.25, no.5, pp.889-900, 2013-11-15 (Released:2013-12-19)
参考文献数
15
被引用文献数
2 1

本研究では,3人の会話において,話者が次々と交替する順番交替の仕組みを,参与者らが表出する態度とその解釈から明らかにする.これまでの順番交替の研究は,現話者と次話者との間に交わされる発話や視線の方向など直接観測可能な情報を対象に分析されてきた.それに対し本稿では,参与者の視線や表情,しぐさは自己の内部状態が表出された態度であると捉え,態度の表出と順番交替の関係を明らかにする.そのため,順番交替の直前に表出される「話したい」「聞きたい」などの態度を評定し,続いて,次に自分が「話し手になる」「聞き手になる」役割志向態度と順番交替の関係を定量的に分析する.さらに,役割志向態度による順番交替のプロセスを事例分析する.結果,聞き手の役割を志向した参与者が次話者になる場合があるなど,表出された態度が参与者相互に解釈理解されて,場に適した順番交替が選択されていることが示唆された.この分析の結果は,コミュニケーションの構造が視線や仕草など,観測される個々の行動だけからではなく,それらを統合して解釈される態度によって検討されることが必要であることを示唆するものである.
著者
石井 亮 大塚 和弘 熊野 史朗 大和 淳司
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.57, no.4, pp.1116-1127, 2016-04-15

複数人対話において,これまで着目されていなかった参加者の頭部運動と次話者との関連性を明らかにし,頭部運動の情報を用いて誰が次話者になるかを予測するモデルを提案する.まず,4者の対話のデータ収録を行い,発話情報,および頭部計測センサから取得される頭部位置,回転角からなる頭部運動情報を含む会話コーパスを構築した.コーパスデータを用いて,現話者の発話末の頭部運動と話者交替の関連性を分析した結果,話者継続時と交替時で,現話者の頭部運動が異なることが示された.また,非話者の発話末の頭部運動と次話者の関連性を分析した結果,話者継続時の非話者,話者交替時の非次話者と次話者の3者間で,頭部運動の特徴が異なることが示された.分析で差が見られた現話者,非話者の頭部運動情報を用いて,話者継続と話者交替のどちらが起こるか,さらに,話者交替時に非話者の中で誰が次話者になるかを2段階で予測する次話者予測モデルを構築した.その予測精度の評価の結果,現話者と非話者の頭部運動情報が話者継続/交替の予測に有用であることが示唆された.また,非話者の頭部運動情報が話者交替時の次話者の予測に有用であることが示唆された.
著者
大塚 和弘 竹前 嘉修 大和 淳司 村瀬 洋
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.7, pp.2317-2334, 2006-07-15
参考文献数
40
被引用文献数
9

複数人物による対面会話を対象とし,会話参加者の視線パターン,頭部方向,および,発話の有無に基づき会話の構造の推論を行うための確率的枠組みを 提案する.本研究では,まず,会話の構造として,話し手,受け手,傍参与者と 呼ばれる参与役割と会話参加者との組合せに着目する.次に,会話中の各人物の 行動は,会話の構造によって規定されるという仮説を立て,マルコフ 切替えモデルと呼ばれる一種の動的ベイジアンネットを用いた会話 モデルを提案する.このモデルは,会話レジームと呼ばれる会話の構造に対応 した上位プロセスの状態が,マルコフ過程に従い時間変化しつつ,その会話 レジームの状態に依存して,視線パターン,および,発話が確率的に生成され,さらに,各人の視線方向に依存して頭部方向が観測されるという 階層的な構造を持つ.このモデルにおいて,会話レジームは,会話中に頻出 する視線パターンの特徴的な構造に基づいて仮説的に設定される.また,ギブスサンプリングと呼ばれる一種のマルコフ連鎖モンテカルロ法を用いて,観測された頭部方向と発話の有無の時系列データより,会話レジーム,視線パターン,および,モデルパラメータのベイズ推定を行う方法を提案する.最後に,4人会話を対象とした実験により,視線方向と会話レジームの推定精度を評価し,提案した枠組みの有効性を確認する.A novel probabilistic framework is proposed for inferring the structure of conversation in face-to-face multiparty communication, based on gaze patterns, head directions, and the presence/absence of utterances. First, as the structure of conversation, this study focuses on the combination of participants and their participation roles. Next, we hypothesize that the structure of conversation governs how people behave during conversation, and propose a conversation model based on the Markov-switching model, a kind of dynamic Bayesian network. In this model, the state of the high-level process, we call it the conversation regime, is assumed to correspond to the conversation structure and that its changes over time exhibit Markov properties. Also, the conversation regime controls the dynamics of utterances and gaze patterns, which stochastically yield measurable head directions. The conversation regimes are hypothetically configured based on typical structures exhibited by gaze patterns among the participants during conversations. Furthermore, a Markov chain Monte Carlo method called the Gibbs sampler is used to realize the Bayesian estimation of conversation regime, gaze pattern, and model parameters from the observed sequential data of head directions and utterances. Finally, experiments on four-person conversations confirm the effectiveness of the proposed framework in estimating gaze directions and conversation regimes.