著者
高津 弘明 福岡 維新 藤江 真也 岩田 和彦 小林 哲則
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.34, no.2, pp.B-I65_1-15, 2019-03-01 (Released:2019-03-01)
参考文献数
46

We have been developing a speech-based “news-delivery system”, which can transmit news contents via spoken dialogues. In such a system, a speech synthesis sub system that can flexibly adjust the prosodic features in utterances is highly vital: the system should be able to highlight spoken phrases containing noteworthy information in an article; it should also provide properly controlled pauses between utterances to facilitate user’s interactive reactions including questions. To achieve these goals, we have decided to incorporate the position of the utterance in the paragraph and the role of the utterance in the discourse structure into the bundle of features for speech synthesis. These features were found to be crucially important in fulfilling the above-mentioned requirements for the spoken utterances by the thorough investigation into the news-telling speech data uttered by a voice actress. Specifically, these features dictate the importance of information carried by spoken phrases, and hence should be effectively utilized in synthesizing prosodically adequate utterances. Based on these investigations, we devised a deep neural network-based speech synthesis model that takes as input the role and position features. In addition, we designed a neural network model that can estimate an adequate pause length between utterances. Experimental results showed that by adding these features to the input, it becomes more proper speech for information delivery. Furthermore, we confirmed that by inserting pauses properly, it becomes easier for users to ask questions during system utterances.
著者
福岡 維新 麥田 愛純 高津 弘明 藤江 真也 林 良彦 小林 哲則
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

ニュース記事の伝達をタスクとして,聞き手が挟む相槌や聞き返しに応じて適宜情報を補完しながら会話を進める音声対話システムを提案する.要点を伝える主発話計画と,それに対し情報を補完する副発話計画を記事から自動生成する機能,これらの発話計画を聞き手の反応に暗に表れる理解状態に応じて切り替える機能を実装した.これらにより,リズムある対話による効率的な情報伝達が実現できた.
著者
藤江 真也
出版者
早稲田大学
雑誌
若手研究(B)
巻号頁・発行日
2004

<1.顔表情認識システムの構築>昨年度の研究結果を踏まえ,本年度は,まず顔表情認識システムを構築した.認識対象とする表情としては,「笑顔」「しかめ」「見開き」と,平常を含む4表情とした.顔領域の中で,上記の表情で特に変化の大きかった眉間,眉毛を含む目,頬,口の部分画像を切り出し,主成分分析(PCA)や線形識別分析(LDA)などに基づき次元圧縮を施したベクトルを特徴量とし,サポートベクターマシンを用いて認識を行った,その結果,80%を超える認識率が得られた.<2.顔方向・視線認識システムの構築>上記に述べた顔表情システムは,基本的にユーザの顔が対話ロボットに正面を向けている場合を想定している.実際の対話では,ユーザの顔向きは様々に変化する.また,顔向きや視線はユーザとシステムとの間での発話権(発話の順番)のやり取りに大きな影響を与えるため,これらを認識することは顔表情と同様に適切な対話制御のために不可欠である.本研究では,画像のテンプレートマッチングの一手法であるLucas-Kanadeアルゴリズムを用いて,顔画像テンプレートマッチング問題を3次元情報を考慮して解くことで顔向きの推定を行った.また,ここで得られた結果から目の部分面像を切り出し,PCAやLDAなどを用いて得られた特徴ベクトルを,部分空間法を用いた識別器にかけることによって視線認識を行った.これらの結果,顔向き認識は平均誤差約5度,視線認識は76%の認識率という結果が得られた.これらのリアルタイムのデモンストレーションをノートPC上に実装した.
著者
藤江 真也 江尻 康 菊池 英明 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.489-498, 2005-03-01
参考文献数
20
被引用文献数
14

音声による人間同士の対話は, 発話に含まれる言語情報に加え, 発話者の心的状態や対話調整的情報が韻律や顔表情, 頭部動作によって付加的に表現されることで円滑に進む.これら, 発話に付随して生起し, 言語情報の円滑な伝達を補助する情報をパラ言語情報と呼ぶ.本論文では, パラ言語情報として, 韻律と頭部ジェスチャに現れる発話者の発話態度を取り上げ, それぞれの認識手法を提案するとともにそれらを活用した対話ロボットを実現する.韻律による発話態度の認識は, 態度が肯定的か否定的かを, F_0パターンと音素の継続長を用いて識別する.頭部ジェスチャによる認識は, 肯定的動作をうなずき, 否定的動作をかしげと首振りとして定め, これら三つの動作をオプティカルフローを特徴量としHMMを確率モデルとして用いることによって認識する.実験により, これらの手法が人と同等の認識能力をもつことを示すとともに, これらを組み込んだ対話ロボットが従来にないリズムある効率的な対話を実現することを示す.
著者
松山 洋一 藤江 真也 齋藤 彰宏 XU Yushi 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
巻号頁・発行日
vol.110, no.221, pp.7-12, 2010-10-01

通所介護施設において,人同士の会話に介在させ,コミュニケーションを活性化するロボットについて報告する.本研究では,具体的なタスクとして高齢者通所施設で行われている難読ゲームを取り上げる.難読ゲームは,司会者の存在する複数人対話の一形態だと考えることができる.ここでロボットは,複数人会話における制約を満たしながら,会話を活性化させるための行動選択を行う必要がある.本論文では,既に人同士で行われているコミュニケーションを妨害せずに活性化を実現するため,会話における参加者の役割や,参加者間が共有する話題を推定しながら,様々な場面において適した行動を取るフレームワークを提案する.
著者
小林 哲則 藤江 真也 小川 哲司 高西 敦夫 松山 洋一 岩田 和彦
出版者
早稲田大学
雑誌
基盤研究(B)
巻号頁・発行日
2008

言語・パラ言語の生成・理解処理を高度化することで,複数の人間と自然なリズムで会話できるコミュニケーションロボットを実現した.また,このロボットを用いて,人同士の会話を活性化することを試みた.この目的のため,ロボットへの性格付与とパラ言語表現機能を考慮したロボットハードウェア,会話状況に沿うロボットの振る舞い,魅力ある会話の進行方式などを設計した.また,ロボットの聴覚機能および発話方式の高度化についても検討した.
著者
中野 鐵兵 佐々木 浩 藤江 真也 小林 哲則
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.46, pp.77-84, 2008-05-15
被引用文献数
5

音声・言語アプリケーションにおける従来の語彙情報作成手法の問題点を解決するため,集合知を利用した語彙情報の収集・共有・管理システムを提案する.具体的には,語彙情報を集中管理するためのオンラインデータベースシステムを構築し,それを利用者に公開する.提案システムでは,Web 資源からの語彙情報の自動収集の枠組みを備え,データの集約を図る.また,アプリケーション用語彙の新規作成から,その継続的な更新まで包括的な解法を提供し,これまで各々の開発者がアプリケーション毎に用意していた語彙定義のプロセスの一元化を図る.さらに,インタフェースを広く公開し,アプリケーション間の語彙定義の共有や,アプリケーションで使用する語彙の自動更新のサポートを図る.本稿では,実際に提案システムの実装として開発されたプロトタイプシステムと,提案システムによって実際に有効な語彙リストの生成が可能である事を示した評価実験について述べる.In order to solve the problems of the conventional approach of designing lexicons, we propose a new approach: using a lexical data collection, sharing, and management system using collective intelligence. In particular, we construct and operate a new online database system for lexical informations. The proposed system is designed as a data intensive system so that it can collect lexical information from all web-based resources. Also, the system provides the comprehensive solution of designing lexicons so that the designing processes of lexicons can be standardized. Besides, the system interface is published so that lexical informations are shared by many applications. In this paper, the prototype system developed based on the proposed approach and the feasibility test for designing lexicons are described. The assessment result showed that the proper lexicons can be generated from the proposed system.