著者
中村 友昭 長井 隆行 船越 孝太郎 谷口 忠大 岩橋 直人 金子 正秀
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.3, pp.498-509, 2015-05-01 (Released:2015-03-26)
参考文献数
30
被引用文献数
1 3

Humans develop their concept of an object by classifying it into a category, and acquire language by interacting with others at the same time. Thus, the meaning of a word can be learnt by connecting the recognized word and concept. We consider such an ability to be important in allowing robots to flexibly develop their knowledge of language and concepts. Accordingly, we propose a method that enables robots to acquire such knowledge. The object concept is formed by classifying multimodal information acquired from objects, and the language model is acquired from human speech describing object features. We propose a stochastic model of language and concepts, and knowledge is learnt by estimating the model parameters. The important point is that language and concepts are interdependent. There is a high probability that the same words will be uttered to objects in the same category. Similarly, objects to which the same words are uttered are highly likely to have the same features. Using this relation, the accuracy of both speech recognition and object classification can be improved by the proposed method. However, it is difficult to directly estimate the parameters of the proposed model, because there are many parameters that are required. Therefore, we approximate the proposed model, and estimate its parameters using a nested Pitman--Yor language model and multimodal latent Dirichlet allocation to acquire the language and concept, respectively. The experimental results show that the accuracy of speech recognition and object classification is improved by the proposed method.
著者
中村 慎也 岩橋 直人 長井 隆行
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.21, no.5, pp.663-682, 2009-10-15 (Released:2010-01-12)
参考文献数
18
被引用文献数
4 2

本論文では,実世界状況において,ロボットが人と効率的及び相互適応的に共有信念を形成しながらコミュニケーションを行うための,発話生成手法を提案する.共有信念は,互いに共通する経験を基盤として形成され,対話者の心的状態の推定や曖昧な発話の理解に用いられる.提案手法は,ロボットが学習する信念システムとして,ロボットの想定する共有信念を表現する関数に加えて,人とロボットの想定する共有信念の一致度を表現する関数を扱う.共有信念を表現する関数は,確率モデルで表される音声言語や動作,オブジェクトの概念などを指示する様々な信念の重み付け和で表現される.共有信念の一致度を表現する関数は,発話が相手に正しく理解される確率の予測値を出力する.信念システムの学習は,人とロボットのオブジェクトを用いたインタラクションを通してオンラインで行われる.ロボットは,一致度を表現する関数を学習することで人の心的状態の推定と発話の予測理解率の推定が可能となり,環境だけでなく,相手との共有信念の一致度に応じて発話の単語数を増減させるなどの適応的な発話生成が行えるようになる.また,そうした発話によるインタラクションを通して一致度を表現する関数自体を更新し,人とロボットが相互適応的に共有信念の形成を行う.ロボットに学習させる信念システムや,人が行動を誤った場合のロボットによる正解の提示の有無など,様々な条件で実験を行い提案手法の有効性を評価した.
著者
中村 友昭 長井 隆行 岩橋 直人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.10, pp.2507-2518, 2008-10-01
被引用文献数
13

本論文では,ロボットが身体性を利用することで取得する視覚・聴覚・触覚のマルチモーダル情報を用い,総合的に物体のカテゴリー分類を行う計算機構を提案する.ロボットは,複数の情報を利用することにより,今まで画像だけでは分類することができなかった物体であっても分類することができるようになり,より人間の感覚に近いカテゴリーを形成することが可能である.提案するアルゴリズムはグラフィカルモデルに基づいており,物体のカテゴリゼーションはそのパラメータである条件付確率を推定する学習の問題となる.提案手法は教師なし学習であるため,人間が正解を教えることなくロボットの自律的なカテゴリゼーションが可能である.また,学習結果を利用した未知物体のカテゴリー認識や,カテゴリーを通した機瀧の確率的推定も可能となる.本論文では,提案するアルゴリズムを実際のロボットに実装することで,提案手法の有効性を示す.
著者
中村 友昭 長井 隆行 岩橋 直人
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.25, 2011

本稿では,ノンパラメトリックベイズの一種であるHierarchical DirichletProcess(HDP)を用いて物体概念の形成を行う.ロボットが実際に物体を掴み,様々な視点から観察することで得られるマルチモーダル情報を,教師なしでカテゴリ分類を行い,物体概念を形成する.HDPを物体のカテゴリゼーションに応用することで,物体概念モデルのパラメータだけでなく,カテゴリ数の推定も可能となる.
著者
濱畑 慶太 谷口 忠大 岩橋 直人 西川 郁子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

ロボットが人間の非分節な動作系列を観察することを通じて多様な動作を獲得することは未だに困難である.そこで,本研究ではDirichlet過程と相互情報量を用いることで,人間の連続的な行動系列から状況に応じた動作を抽出するメカニズムの提案を行う.実験では,モーションキャプチャを用いて計測を行った人間の連続的な行動系列から状況に対応した複数の動作の抽出を行った.
著者
谷口 忠大 岩橋 直人 新田 恒雄 岡田 浩之 長井 隆行
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第25回 (2011)
巻号頁・発行日
pp.2B2OS22a1, 2011 (Released:2018-07-30)

ロボティクス,音声言語,画像研究を含むマルチモーダルインタラクション研究の発展に伴い,自律ロボットが人間と共生することを目標としつつ,記号過程を内包した人間知能構成論的理解を進める研究が始まっている.ロボットが人間や環境との相互作用を通して,コミュニケーションに必要な知識を発見・理解・学習・運用する過程の研究を計算論的に統合することは重要である.本発表では当該研究領域について概説する.
著者
田口 亮 岩橋 直人 能勢 隆 船越 孝太郎 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第23回全国大会(2009)
巻号頁・発行日
pp.1F2OS72, 2009 (Released:2018-07-30)

本稿では,単語の知識を持たないロボットが,人の自由な発話から物や場所の名前を学習する手法を提案する.初期の単語候補は,学習データの音素認識結果から生成する.この単語候補を用いて単語認識と意味・文法の学習を行い,統計的モデル選択の基準を元に,音響的,文法的,意味的に不要な単語を削除・連結する.そして再び単語認識を行う.これを繰り返すことで,単語の正しい音素系列と意味が獲得される.
著者
中村 友昭 長井 隆行 岩橋 直人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.375, pp.7-12, 2010-01-14

本稿では,ロボットが身体性を利用することで取得する視覚・聴覚・触覚のマルチモーダル情報を用い,総合的に物体のカテゴリ分類を行うことで,物体概念を形成する手法を提案する.ロボットは,複数の情報を利用することにより,今まで画像だけでは分類することができなかった物体であっても分類することができるようになり,より人間の感覚に近い物体概念を形成することが可能である.提案するアルゴリズムはグラフィカルモデルに基づいており,物体のカテゴリゼーションはそのパラメータである条件付確率を推定する学習の問題となる.提案手法は教師なし学習であるため,人間が正解を教えることなくロボットの自律的なカテゴリゼーションが可能である。また,学習結果を利用した未知物体のカテゴリ認識や,カテゴリを通した機能の確率的推定も可能となる.さらに本稿では,マルチモーダルLDAにより形成された概念を基に,単語の意味を接地する手法を提案する.提案手法では,入力されたマルチモーダル情報に対応する単語を確率的に推論することや,単語からその単語が指す概念を推定すること,さらに単語とモダリティとの結びつきを求めることが可能となる.本論文では,提案するアルゴリズムを実際のロボットに実装することで,提案手法の有効性を示す.
著者
中野 幹生 能勢 隆 田口 亮 水谷 了 中村 友昭 船越 孝太郎 長谷川 雄二 鳥井 豊隆 岩橋 直人 長井 隆行
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

発話と画像情報を入力として,物の名前を覚えるロボットが研究されているが, 名前を覚えさせるモードをあらかじめ設定しておかなくてはならなかったり, 名前を覚えさせる発話のパタンが決まっていたりした.本稿では,さまざまな ドメインの対話を行うことができ,対話の途中で物の名前を教示する発話を聞 くと学習を行うことができるロボットのアーキテクチャとその実装について述 べる.
著者
金 景柱 岩橋 直人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.100, no.336, pp.9-16, 2000-10-06
被引用文献数
14

本報告では, 音声と画像情報を統合的に処理することにより, 単語と単語を構成する音声セグメントを獲得するための原理およびアルゴリズムについて述べる.音声セグメントと単語の階層構造を, 音声に対応づけれた画像情報を用いていかに獲得するかが問題であり, これを解決するための相互情報量規準に基づいた情報理論的学習原理が示される.これにより, 音声セグメント, それによって構成される単語, および各単語に対応付けられる画像概念が同時に求められる.アルゴリズムでは, 音声セグメントと単語と動的画像概念が隠れマルコフモデル, 静的画像概念が多次元正規分布で表現され, これらの確率モデルの数とパラメータ値が自動決定される.単語を孤立発声した音声とぬいぐるみの画像を用いた実験を行ない, 言語音声単位と画像概念が適切に獲得できることを示す.
著者
中村 友昭 西原 成 長井 隆行 船越 孝太郎 長坂 翔吾 谷口 忠大 岩橋 直人
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本稿では,マルチモーダル情報によって構築される物体概念と,人の発話を教師なしで形態素解析することで切り出される単語から,ロボットによる語意の獲得を行う.ロボットは,言語などの初期知識を持たないことを想定しているため,音声認識では必ずしも正しく人の発話を認識できるとは限らない.そこで,本稿では物体概念と同時に言語モデルも学習することで,認識誤りの影響を低減し,概念・語意の獲得が可能であることを示す.
著者
宮田 篤人 岩橋 直人 槫松 明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.520, pp.87-92, 2001-12-13

本稿では, 人との自然な言語コミュニケーションの基盤となる相互信念を, ロボットが発話理解過程を通して学習する方法について述べる.本方法では, 相互信念は, 複数の信念と, 各信念が人と共有されている確信の強さを示す重み付けによって, 表現される.学習される相互信念は, 音韻, 語彙, 文法, 行動コンテキストの影響, およびその他の非言語的な信念からなる.実験により, はじめは簡単な言語知識しか持たないアームロボットが人と言語と行動を介したインタラクションを通して相互信念を学習し, 断片的であいまいな発話を状況に応じた相互信念を用いて適切に理解して行動できるようになることを示す.本方法は, 人とロボットのインタラクションにおいて, 言語処理と身体性を反映した認知処理の融合を実現しており, より自然なコミュニケーションの実現のための新しいフレームワークを提供するものと考えている.
著者
谷口 忠大 岩橋 直人 新田 恒雄 岡田 浩之 長井 隆行
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.25, 2011

ロボティクス,音声言語,画像研究を含むマルチモーダルインタラクション研究の発展に伴い,自律ロボットが人間と共生することを目標としつつ,記号過程を内包した人間知能構成論的理解を進める研究が始まっている.ロボットが人間や環境との相互作用を通して,コミュニケーションに必要な知識を発見・理解・学習・運用する過程の研究を計算論的に統合することは重要である.本発表では当該研究領域について概説する.
著者
平井 俊男 岩橋 直人 樋口 宜男 匂坂 芳典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.11, pp.1572-1580, 1995-11-25
被引用文献数
15

日本語合成音の自然性向上を目指して,音声の基本周波数(以下,F_0)制御のための規則を自動的に抽出する方法を提案した.本方法は,(1)十分な量の音声データのF_0時系列パターンを藤崎モデルによりパラメータ化し,(2)このパラメータの値を言語情報から推定する規則,すなわちF_0制御規則を統計分析手法により抽出する,という二つのステップからなる.この方法を話者1名による読上げ文200文に適用し,得られたF_0制御規則を解析することで,言語情報とパラメータ値との関係を導出した.その結果,(1)先行フレーズのモーラ数が少なくなるほど当該フレーズ指令は小さくなること,(2)アクセント句内の高く発音される部分のモーラ数が多くなるほどアクセント成分が小さくなるという関係があること,が明らかとなった.(2)の関係は,従来少数サンプルの分析結果で得られていた知見を詳細化したものとなっており,本手法によって妥当なF_0制御規則の抽出を自動的に行える可能性があることを示したものと考えられる.
著者
田口 亮 岩橋 直人 船越 孝太郎 中野 幹生 能勢 隆 新田 恒雄
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.4, pp.549-559, 2010 (Released:2010-06-30)
参考文献数
18
被引用文献数
2 2

This paper proposes a method for the unsupervised learning of lexicons from pairs of a spoken utterance and an object as its meaning under the condition that any priori linguistic knowledge other than acoustic models of Japanese phonemes is not used. The main problems are the word segmentation of spoken utterances and the learning of the phoneme sequences of the words. To obtain a lexicon, a statistical model, which represents the joint probability of an utterance and an object, is learned based on the minimum description length (MDL) principle. The model consists of three parts: a word list in which each word is represented by a phoneme sequence, a word-bigram model, and a word-meaning model. Through alternate learning processes of these parts, acoustically, grammatically, and semantically appropriate units of phoneme sequences that cover all utterances are acquired as words. Experimental results show that our model can acquire phoneme sequences of object words with about 83.6% accuracy.
著者
船越 孝太郎 木村 法幸 中野 幹生 岩橋 直人
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.5, pp.610-620, 2010-05-01

本論文では,少数の教示発話から,ユーザが任意に決めた物体や場所の名称をロボットが学習し識別するための手法を提案する.高齢者や児童も含めたユーザの使いやすさを高めるためには,語彙や言い回しに関する制限を課さないことが重要である.また,背景雑音などによって生じる誤認識に対して頑健でなければならない.そこで提案手法では,大語彙連続音声認識を用いて入力音声を認識し,複数の認識候補(N-best)に対しbag-of-wordsモデルに基づくトピック分類を適用することで,語彙や言い回しの制限を無くし,音声の誤認識に対して頑健な名称識別を可能にする.評価実験では,10の名称と六つの異なる言い回しを用いて16人分の音声発話を収集した.これらの音声発話を,雑音なし,雑音あり,雑音があり名称がすべて辞書に未登録,という三つの条件で音声認識し,その認識結果を用いて名称の学習と識別を行った.実験により,提案手法が言い回しの多様性や誤認識に対して頑健に名称を識別できることを確認した.分類手法としては,EMM,SVMV,LSAの3手法を比較し,LSAで最も良い結果を得た.また,N-bestからの頻度情報の抽出に関して,トークン計数法とタイプ計数法の二つの手法を比較し,我々の問題設定においてはタイプ計数法が適当であることを確認した.