著者
小椋 忠志 MAGASSOUBA Aly 杉浦 孔明 平川 翼 山下 隆義 藤吉 弘亘 河井 恒
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.1Q3GS1105, 2020 (Released:2020-06-19)

生活支援ロボットは,在宅介護労働者の不足に対する有望な解決策である. 一方で,生活支援ロボットの主な制限の1つに,言語を介して自然に相互作用できない点がある. 近年の研究では,data-drivenのアプローチがあいまいな指示の処理に有効であることが示されているものの,大規模なデータセットを必要とすることが多く,その構築は時間と費用を要する. したがって,生活支援ロボットにおける命令文の自動生成手法は,このコストを大幅に削減し,アノテーション作業の負担を軽減することが期待できる. そこで本稿では,入力画像から把持命令文を生成する手法を提案する. 提案手法は,subword-levelの注意機構を持ち,subword embeddingに基づいて文を生成するMultimodal Attention Branchを有する. 実験では,画像キャプショニングに適した4つの標準的な尺度を使用して提案手法とベースライン手法との比較を行った. 実験結果では,提案手法がこれらの尺度においてベースライン手法を上回ることを示した.