著者
嵯峨山 茂樹 川本 真一 下平 博 新田 恒雄 西本 卓也 中村 哲 伊藤 克亘 森島 繁生 四倉 達夫 甲斐 充彦 李晃伸 山下 洋一 小林 隆夫 徳田 恵一 広瀬 啓吉 峯松 信明 山田 篤 伝 康晴 宇津呂 武仁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.14, pp.57-64, 2003-02-07
参考文献数
24
被引用文献数
42

筆者らが開発した擬人化音声対話エージェントのツールキット``Galatea''についてその概要を述べる。主要な機能は音声認識、音声合成、顔画像合成であり、これらの機能を統合して、対話制御の下で動作させるものである。研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果、顔画像が容易に交換可能で、音声合成が話者適応可能で、対話制御の記述変更が容易で、更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり、かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった。この成果はソース公開し、一般に無償使用許諾する予定である。This paper describes the outline of "Galatea," a software toolkit of anthropomorphic spoken dialog agent developed by the authors. Major functions such as speech recognition, speech synthesis and face animation generation are integrated and controlled under a dialog control. To emphasize customizability as the dialog research platform, this system features easily replaceable face, speaker-adaptive speech synthesis, easily modification of dialog control script, exchangeable function modules, and multi-processor capability. This toolkit is to be released shortly to prospective users with an open-source and license-free policy.
著者
片桐 恭弘 石崎 雅人 伝 康晴 高梨 克也 榎本 美香 岡田 将吾
出版者
日本認知科学会
雑誌
認知科学 (ISSN:13417924)
巻号頁・発行日
vol.22, no.1, pp.97-109, 2015-03-01 (Released:2015-09-15)
参考文献数
20

Conversational interactions contribute not only to the sharing of information and establishment of consensus but also to the construction and sustenance of mutual trustamong conversational participants in our daily lives. The interrelationship betweentrust and conversational interactions has not been studied extensively in cognitive sci-ence. One reason for this lack of research is the fact that a study of social emotions suchas trust requires real fields, since social emotions in their natural, non-artificial formsare not readily observable in laboratory settings. We introduce a notion of concernalignment to describe the surface conversational processes toward mutual trust forma-tion. Focusing on medical communications as our research field, we collected healthguidance conversations between nurses and patients who were diagnosed as havingmetabolic syndrome, and we provide a qualitative analysis of the structure of conver-sations in terms of a set of dialogue acts we propose for the description of concernalignment processes. We demonstrate that the idea of concern alignment enables us tocapture and elucidate both the local and the global structures of mutual trust formationin conversational consensus-building processes. We also discuss underlying mechanismsconnecting concern alignment and mutual trust.
著者
小木曽 智信 小椋 秀樹 田中 牧郎 近藤 明日子 伝 康晴
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.4, pp.1-8, 2010-01-30

現在開発を行っている「中古和文UniDic」を紹介する.これは平安時代の仮名文学作品を典型とする和文系の資料を対象とする形態素解析辞書であり,すでに公開中の「近代文語UniDic」同様,日本語の歴史的資料の形態素解析を可能にするものである.In this paper, we present "Chuko-Wabun UniDic", which is an electrical dictionary for morphological analysis of classical Japanese. The dictionary is especially designed for the analysis of literary texts in the Heian period, and is an effective means for examining historical texts, like "Kindai-Bungo UniDic" for modern Japanese.
著者
小磯 花絵 伝 康晴
出版者
日本認知科学会
雑誌
認知科学 (ISSN:13417924)
巻号頁・発行日
vol.7, no.1, pp.93-106, 2000 (Released:2008-10-03)
参考文献数
24
被引用文献数
4

Participants in conversation take speaking turns regularly and smoothly although who speaks and when he speaks are not decided in advance. Great attention has been paid to these phenomena in various areas. As for processing models of turn-taking, however, only the code model based on turn-taking signals has been proposed so far, wihch has been pointed out, by several researchers, to have serious problems. In this paper, we propose an alternative model, the autonomous model. The basic assumptions of this model are: (1) the speaker and the hearer share cognitive environment including the speaker's speech, according to which the hearer takes her own speech actions, and (2) unlike the code model, the hearer need not decode speaker's intent on his speech actions. We predict the distribution of smooth, as well as non-smooth, transitions between speakers based on the autonomous model and the code model, and compare them with those observed in real spoken dialogues, showing that the autonomous model can account for fundamental characteristics of turn-taking phenomena more precisely than the code model. We further discuss how the autonomous model accounts for the predominant occurrence of smooth transitions.
著者
伝 康晴 渡辺 美知子
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.13, no.1, pp.53-64, 2009-04-30

Speech disfluency has lately attracted considerable attention in the study of spontaneous speech. In one tradition, disfluencies are treated as the outcome of cognitive processes that run purely inside the speaker. In a second tradition, they are viewed as the result of certain strategies by which the speaker can have an effect on the addressees. This paper reviews our recent studies on disfluencies in Japanese spontaneous speech, putting particular emphasis on their functions in speech communication. Three studies, on word repetitions, fillers, and prolongation, are described in detail and discussed from the viewpoint of communicative strategies.
著者
榎本 美香 石崎 雅人 小磯 花絵 伝 康晴 水上 悦雄 矢野 博之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎 (ISSN:09135685)
巻号頁・発行日
vol.104, no.445, pp.45-50, 2004-11-11
参考文献数
10
被引用文献数
1

本稿では,会話相互行為の実証的な分析にふさわしい単位について考察するために,これまでに提案されているいくつかの単位間の比較を行う.比較する分析単位として間休止単位・韻律単位・節単位・スラッシュ単位・ターン構成単位を取り上げる.まず,各単位の判定基準に基づき,共通データ(3人会話)の単位区切りを行う.次に,ターン構成単位を軸としてその他の単位との境界の一致傾向を調べる.また,数量化II類を用いてターン構成単位の境界の有無をその他の単位から予測するモデルを構成し,ターン構成単位へのそれぞれの単位の影響について検討する.分析の結果,ターン構成単位との一致が強いのは節単位・スラッシュ単位であり,予測モデルに大きな影響を与えるのは節単位と一部の韻律単位であることを示す.
著者
渡辺 美知子 広瀬 啓吉 伝 康晴 峯松 信明
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.62, no.5, pp.370-378, 2006-05-01
被引用文献数
7

自発発話において,直前にフィラーのある,句や節などの主要構成素は,そうでない主要構成素に比べ,長い傾向がある。そのような傾向を聴き手が経験的に把握し,フィラーを,後続句の長さや内容の複雑さを予測する手掛かりとして用いているかどうかを,句境界のフィラー,「エート」について調べた。「エート」の後続句が指し示す対象を聴き手が同定するのにかかる時間は,「エート」がない場合と比べ,後続句が長い場合のみ短く,後続句が短く単純な場合は有意差がなかった。この結果から,句境界の「エート」は聴き手にとって,後続句の長さ,内容の複雑さを知る上での手掛かりとなっていることが示唆された。
著者
嵯峨山 茂樹 伊藤 克亘 宇津呂 武仁 甲斐 充彦 小林 隆夫 下平 博 伝 康晴 徳田 恵一 中村 哲 西本 卓也 新田 恒雄 広瀬 啓吉 峯松 信明 森島 繁生 山下 洋一 山田 篤 李 晃伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.103, no.518, pp.73-78, 2003-12-12

擬人化音声対話エージェントのツールキット"Galatea"の開発プロジェクトについて報告する.Galateaの主要な機能は音声認識,音声合成,顔画像合成であり,これらの機能を統合して,対話制御の下で動作させるものである.研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果,顔画像が容易に交換可能で,音声合成が話者適応可能で,対話制御の記述変更が容易で,更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり,かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった.この成果はダウンロード可能となっており,一般に無償使用許諾している.