著者
前川 喜久雄 斎藤 純男 藤本 雅子 竹本 浩典 北村 達也 菊池 英明 籠宮 隆之
出版者
大学共同利用機関法人人間文化研究機構国立国語研究所
雑誌
基盤研究(B)
巻号頁・発行日
2017-04-01

東京方言16名分、近畿方言5名分、モンゴル語3名の調音運動を記録したリアルタイムMRI動画を1名あたり約1時間収集した。データのブラウジング環境を構築し、音声器官(舌、唇、口蓋、咽頭壁など)の輪郭を自動抽出する技術を開発した。このデータを利用して、①モンゴル語母音調和に関する舌根位置の関与を示した論文、②日本語発話末に生じる撥音の調音位置が直前母音によって決まっていることを示した論文、③日本語ワ行子音の調音が定説となっている二重調音ではなく、主に両唇の接近によって行われていることを示した論文を発表した。さらに日本語のラ行子音に関する分析も発表した。
著者
清水 健吾 上垣 貴嗣 菊池 英明
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 94回 (2022/3) (ISSN:09185682)
巻号頁・発行日
pp.06, 2022-02-25 (Released:2022-02-25)

雑談対話システムがユーザに「また対話したい」と思わせるための方法として,特定のキャラクタらしさをシステム応答に付与する方法が考えられる.本研究は,強化学習を用いてニューラル対話生成モデルをfine-tuningすることで,特定のキャラクタらしい雑談応答を生成する対話生成モデルを提案する.Fine-tuningの際に,特定のキャラクタらしさを持つ独立した発話データのみを必要とし,対話形式のデータを必要としない点で既存研究と大きく異なる.評価実験では,被験者に提案手法による対話システムとチャットアプリ上で数ターンの対話を行ってもらった.評価実験の結果,提案手法による対話システムが,ユーザに特定のキャラクタらしさの印象を与え,「また対話したい」と思わせる効果を持つことを確認した.
著者
金礪 愛 菊池 英明
出版者
Japan Society of Kansei Engineering
雑誌
日本感性工学会論文誌 (ISSN:18845258)
巻号頁・発行日
pp.TJSKE-D-17-00069, (Released:2017-11-09)
参考文献数
22

This paper describes the relationship between voice quality of singing voice and color. We conducted 2 experiments. As stimuli, 28 voices were recorded from 11 amateur female singers. First, matching between voice quality and color was made with paired comparison. Color stimuli were categorized by 3 conditions and selected from the PCCS color system. As a result of binomial test, raters tended to agree with each other in the lightness condition. Second, voice stimuli were evaluated with 13 pairs of word as psychological features and 3 factors were extracted by factor analysis. In addition, 10 acoustic features were calculated as physical features. Based on the result of correlation analysis, it turned out that many features of colors are associated with impressions like a factor of “activity”. We also found that spectral centroid and spectral tilt might be related to some of the color features in the analysis of physical features.
著者
菊池 英明 工藤 育男 小林 哲則 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1502-1511, 1994-08-25
被引用文献数
19

音声を利用したマルチモーダルインタフェースのベースシステムとなる音声対話インタフェースにおいて,ユーザに発話のタイミングに関する自由を保証するための割込みの扱いについて検討した.ユーザに割込みを許すとき,従来のように1文を単位としてシステムの発話を計画するのでは,計画した発話内容と実際に発話した内容あるいはユーザが受け取った内容の間に差異が生じる.そこで,発話の計画の単位を,1文中の伝えるべき情報と定め,対話中に話者間でやりとりされる発話権を管理することにより,どの情報が受聴されたかを常に把握する方式を提案した.実験の結果,提案した方式によって,システムが計画した発話とユーザが受聴した発話の差異をなくしながら,スムーズな割込みへの対処が被験者の半数以上に認められた.また,割込みに対処することにより,ユーザのタスク完了までの所用時間は7%減少し,積極的な話題提起数が21%増えるなど,インタフェースの利便性が向上することが確認された.
著者
市川 熹 大橋 浩輝 仲 真紀子 菊池 英明 堀内 靖雄 黒岩 眞吾
出版者
科学・技術研究会
雑誌
科学・技術研究 (ISSN:21864942)
巻号頁・発行日
vol.5, no.1, pp.113-122, 2016 (Released:2016-07-07)

母語話者の話者交替時の重複タイミング現象である話者移行適格場(TRP)に注目し、日本語と英語について、それぞれの母語話者とその言語を十分に習得している非母語話者の実時間対話を分析した。両言語ともに、対話者が母語話者の組み合わせ以外ではTRPの制約が成立していなかった。このことは、非母語話者が発信している言語情報は話者交替の予告情報にはならず、言語情報の裏に必然的に存在するプロソディにあることを示唆している。また日本語母語話者の5歳児と6歳児と成人の対話を分析し、さらに先行研究結果を参考にしたところ、日本語母語のTRPの制約は5歳児ころまでに獲得されることが推察された。母語話者の話者交替タイミング制御のモデルを提案した。
著者
江田 康太郎 菊池 英明
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18845258)
巻号頁・発行日
pp.TJSKE-D-21-00032, (Released:2021-11-16)
参考文献数
17

Sound symbolism is the non-arbitrary associations between pseudowords and meanings. It has been reported that these associations extend to the lexical stimulus (e.g., names and faces); however, it is not clear whether non-native English speakers feel the same way. Experimental results using the stimuli that have existing associations might be affected by language family. In this study, we created high-quality images of Caucasians with generative modeling and then conducted a questionnaire survey on Japanese native speakers. The results showed that names containing round-sounding phonemes could be associated with face images possessing feature amounts related to roundness. The same is true of sharpness. This tendency implies Japanese native speakers also feel the non-arbitrary associations between names and faces.
著者
宮島 崇浩 菊池 英明 白井 克彦 大川 茂樹
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.17, no.3, pp.10-23, 2013-12-30 (Released:2017-08-31)

This paper explains the procedure to enhance the expressiveness in acted speech. We designed our own "format of acting script" referring to the theory of drama and created 280 acting scripts. We presented these acting scripts as acting directions to three actresses and collected 840 speech data. For comparison, using typical emotional words as acting directions, we also collected 160 speech data from each actress. Then, we compared tendencies of various features of each data type and each speaker and found that our acting scripts are effective on the enhancement of expressiveness in acted speech psychologically/acoustically.
著者
前川 喜久雄 籠宮 隆之 小磯 花絵 小椋 秀樹 菊池 英明
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.4, no.2, pp.51-61, 2000-08-30 (Released:2017-08-31)
被引用文献数
2

Compilation of a large-scale corpus of spontaneous Japanese monologue is underway as a joint work of the National Language Research Institute (under the Agency of Cultural Affairs) and the Communications Research Laboratory (under Ministry of Post and Telecommunication). The corpus will contain about 700 hours of digitized speech (about 7 million morphemes), its transcription, and various tagging information such as POS information. Phonological labels (segmental as well as prosodic) will be provided for a subset of the corpus. The corpus will become publicly available in the spring of 2004.
著者
榊原 弘之 倉本 和正 菊池 英明 中山 弘隆 鉄賀 博己 古川 浩平
出版者
公益社団法人 土木学会
雑誌
土木学会論文集 (ISSN:02897806)
巻号頁・発行日
vol.2000, no.658, pp.221-229, 2000

本論文では, がけ崩れに寄与する重要要因の抽出を目的として, ラフ集合を用いたデータマイニングを山口県のがけ崩れ発生・非発生データに対して実施する. まず, 地形要因データにおける重要要因を抽出し, 比較的少数の要因によって, 大部分のがけ崩れ発生・非発生を矛盾なく説明できることを示す. さらに, 地形要因と降雨要因を組み合わせたデータへも同様の手法を適用し, 降雨時に警戒対象とすべきがけの選別手法を示した. 本論文により, ラフ集合によるデータマイニングを土砂災害の発生・非発生データの分析に用いることができることが明らかとなった.
著者
楊 潔 菊池 英明
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3Rin418, 2020 (Released:2020-06-19)

言語的協同は対話参加者が繰り返し発話などを通じて相手に似せた方法で対話に参与する行為である。本研究では人間同士の自由対話における繰り返し型の言語的協同の特徴量を分析した上で、ユーザの属性を考慮にいれて対話ロボットによる言語的協同がユーザに与える効果を検証する。大学(院)生38人を対象としてWOZ法による対話実験を行なった。実験の条件は一対話中の協同発話の頻度によって低頻度・中頻度・高頻度に分け、頻度条件ごとに実験群(協同発話)と対照群(相槌)を設けた。被験者は対話ごとに共感と対話継続欲求に関わる三つの項目に対する5段階評価を行なった。その結果から、高頻度の言語的協同は共感促進と対話継続欲求2の向上に効果があると考えられた。また、本実験の範囲で、言語的協同の頻度が高いほど共感の効果が顕著であることが考えられた。最後に、ロボットへの否定的態度が強いユーザ・ロボットへの不安感が強いユーザほど言語的協同の効果が高まることが示唆された。
著者
前川 喜久雄 菊池 英明 五十嵐 陽介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.521, pp.25-30, 2001-12-14
被引用文献数
3

本稿では日本語の韻律ラベリングスキームであるJ_ToBIを拡張した新スキーム、X-JToBI(eXtended J_ToBI)を提案する。新スキームでは分節音ラベリングが実施されていることを前提として、J_ToBIの問題点であったtoneラベル位置と物理的イベントの不一致を解消した。さらに自発音声の韻律ラベリングを実施するために必要とされる多くの拡張を施した。この拡張には、BPMインベントリの拡張と表示方法の変更、BIラベルの詳細化、フィラー用ラベルの提案、卓立のラベリング法などが含まれる。
著者
宮島 崇浩 菊池 英明 白井 克彦 大川 茂樹
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.17, no.3, pp.10-23, 2013-12-30

This paper explains the procedure to enhance the expressiveness in acted speech. We designed our own "format of acting script" referring to the theory of drama and created 280 acting scripts. We presented these acting scripts as acting directions to three actresses and collected 840 speech data. For comparison, using typical emotional words as acting directions, we also collected 160 speech data from each actress. Then, we compared tendencies of various features of each data type and each speaker and found that our acting scripts are effective on the enhancement of expressiveness in acted speech psychologically/acoustically.
著者
横山 真男 青山 一美 菊池 英明 帆足 啓一郎 白井 克彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.2, pp.487-496, 1999-02-15
被引用文献数
16

人間型ロボットのコミュニケーション能力を人間のそれに近付けるために 人間同士のコミュニケーションにおいて重要な役割を持つ視線や手振りなど非言語情報の利用を検討した. 本論文では まず人間同士の対話において 各種非言語情報の出現タイミングについての分析を行う. さらに ロボット側の非言語情報の出力タイミングによる対話への影響を分析する. 分析の結果 非言語情報の種類による発話交替における制約としての強さや自然性の違いが明確になった. また 非言語情報の出力タイミングとして 人間同士と同様に発話開始直後あるいは終了時が自然かつ円滑な対話の実現にとって適切であることが確かめられた. 最後に ロボットへの視線情報制御の適用を行い インタフェース評価実験の結果より ロボットの対話インタフェースにおける非言語情報制御の有効性について述べる.In this research, we consider the use of non-verbal information in human-robot dialogue to draw the communication ability of robots closer to that of human beings. This paper describes analysis of output timing of non-verbal informatin in the dialogues between human beings. Moreover, we analyse infuluences of the output timing by controlling it in the dialogue of a CG robot. As the result, we clarify the strength of constraint and naturalness of various types of non-vervbal information. Also, we confirm that appropriate output timing of non-verbal information is during or at the end of utterances, which is the same as in human-human dialogue. At last, we applied non-verbal information to the humanoid robot and made similar experiments. As a rsult, non-verbal information made speaker-changing more smoothly for the humanoid robot than in the case of the CG robot.
著者
小林 哲則 中川 聖一 菊池 英明 白井 克彦 匂坂 芳典 甲斐 充彦
出版者
早稲田大学
雑誌
特定領域研究
巻号頁・発行日
2000

今年度の成果は以下の通りである。a)対話のリズムと韻律制御前年度までの成果に基づいて、対話における話題境界の判別を題材に、韻律情報におけるアクセント句単位でのパラメータを用いて統計的なモデルを学習し、オープンデータに対しても人間と同程度の判別精度が得られることを確認した。(白井・菊池)自然な対話システムを構築する上で重要なシステム側の相槌生成と話者交替のタイミングの決定を、韻律情報と表層的言語情報を用いて行う方法を開発した。この決定法を、実際に天気予報を題材にした雑談対話システムに実装し、被験者がシステムと対話することにより主観的な評価を行い、有用性を確認した。(中川)b)対話音声理解応用対話音声における繰り返しの訂正発話に関する特徴の統計的な分析結果を踏まえ、フレーズ単位の韻律的特徴の併用と訂正発話検出への適用を評価した。また、これらと併せた頑健な対話音声理解のため、フィラーの韻律的な特徴分析・モデル化の検討を行った。(甲斐)c)対話音声合成応用語彙の韻律的有標性について程度の副詞を用い、生成・聴覚の両面から分析を行い、自然な会話音声生成のための韻律的強勢制御を実現した。また、統計的計算モデルによる話速制御モデルを作成し、会話音声にみられる局所話速の分析を進め、自由な話速の制御を可能とした。さらに、韻律制御パラメータが合成音声の自然性品質に及ぼす影響を調べた。(匂坂)d)対話システム上記の成果をまとめ,対話システムを実装した。特に,顔表情の認識・生成システム,声表情の認識・生成システムなどを前年度までに開発した対話プラットホーム上に統合し,パラ言語情報の授受を可能とするリズムある対話システムを構築した。(小林)
著者
藤江 真也 江尻 康 菊池 英明 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.489-498, 2005-03-01
参考文献数
20
被引用文献数
14

音声による人間同士の対話は, 発話に含まれる言語情報に加え, 発話者の心的状態や対話調整的情報が韻律や顔表情, 頭部動作によって付加的に表現されることで円滑に進む.これら, 発話に付随して生起し, 言語情報の円滑な伝達を補助する情報をパラ言語情報と呼ぶ.本論文では, パラ言語情報として, 韻律と頭部ジェスチャに現れる発話者の発話態度を取り上げ, それぞれの認識手法を提案するとともにそれらを活用した対話ロボットを実現する.韻律による発話態度の認識は, 態度が肯定的か否定的かを, F_0パターンと音素の継続長を用いて識別する.頭部ジェスチャによる認識は, 肯定的動作をうなずき, 否定的動作をかしげと首振りとして定め, これら三つの動作をオプティカルフローを特徴量としHMMを確率モデルとして用いることによって認識する.実験により, これらの手法が人と同等の認識能力をもつことを示すとともに, これらを組み込んだ対話ロボットが従来にないリズムある効率的な対話を実現することを示す.