著者
石黒 浩 中村 泰 西尾 修一 宮下 敬宏 吉川 雄一郎 神田 崇行 板倉 昭二 平田 オリザ 開 一夫 石井 カルロス寿憲 小川 浩平
出版者
大阪大学
雑誌
基盤研究(A)
巻号頁・発行日
2013-04-01

人と関わるロボットの自律動作と遠隔操作の機能を統合することで,人間やロボットが存在する社会的で現実的な場面において, 発話やジェスチャーなどの社会的振る舞いを行い, 社会に参加できるロボットシステムの実現を目指すとともに, 社会的な対話の認知心理学的な理解とモデリングに取り組んだ.今年度は, 以上の取り組みを開始したところであったが, 本提案をさらに発展させた, 人間に酷似したロボットであるアンドロイドの機構の改良や BMI の導入を含む基盤研究 S "人のような存在感を持つ半自律遠隔操作型アンドロイドの研究" が採択されたため,5月31日をもって,本研究課題を廃止し, 基盤研究 S の一部として研究を推進している.本研究課題実施時の具体的な研究内容としては, 1. 対人状況における注意制御機能と遠隔操作機能の統合の一部として, 学習アルゴリズムに基づくロボットの自律制御に関する研究, 及び, 2. 社会的状況における対話の認知科学的モデル化の研究の一部として, ロボット演劇中のロボットが人にアプローチするシーンの演出データからの社会的振る舞いの抽出に取り組んだ.現在, 基盤研究 S として, 物理的なインタラクションをも自然にするための電磁リニアアクチュエータを用いたアンドロイドの開発,複数人による雑談などの具体的な社会的状況における対話とそれに伴う行動の記録と分析に基づく対話モデルの構築や, 遠隔操作の記録を基にしたアンドロイドの自律化に取り組んでおり, 今後,行う予定のブレインマシンインターフェースによる遠隔制御の導入などとともに, 人との多様な相互作用を行うアンドロイドの開発, 社会的存在としての機能の実現, 現実社会におけるアンドロイドの社会参加の実現に取り組む.
著者
湯口 彰重 河野 誠也 石井 カルロス寿憲 吉野 幸一郎 川西 康友 中村 泰 港 隆史 斉藤 康己 美濃 導彦
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.40, no.10, pp.932-935, 2022 (Released:2022-12-24)
参考文献数
8

We propose an autonomous mobile robot Butsukusa, which describes its observations and internal states during the looking-around task. The proposed robot observes the surrounding environment and moves autonomously during the looking-around task. This paper examined several language generation systems based on different observation and interaction patterns to investigate better communication protocol with users.
著者
石井 カルロス寿憲 榊原 健一 石黒 浩 萩田 紀博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.89, no.12, pp.2679-2687, 2006-12-01
参考文献数
20

Vocal fry(フライ)は,声帯振動の様式に起因する声質の一種であり,気分的にテンションが低くリラックスしている場合や,強い感情や態度の表現の際に喉頭を力んだ場合に生じ,バラ言語や非言語情報を伝達する役割をもっている.本論文は,音声信号からフライ区間を自動的に検出することを目的としている.フライは通常発声よりも低い基本周波数の範囲で生じやすい.ゆえに,典型的な固定フレーム長の短時間処理が問題となるが,その解決策として,本論文では声帯パルスに同期した手法を提案した.具体的には,フライの声帯パルスのインパルス的な特性とダンピング特性を考慮し,超短時間処理で求めたパワー軌道から声帯パルスの候補となるパワーピークを検出する.検出されたパワーピークにおいて,周期性とパルス間類似度を用いて,フライであるか,それともインパルス的な雑音であるかを判定する.評価実験として,パワーピーク検出・周期性・パルス間類似度に関連するしきい値パラメータを様々な条件で分析した.その結果,73%の高い検出率と4%の低い挿入誤り率により,自動的にフライ区間が検出可能であることが示された.
著者
波多野 博顕 石井 カルロス寿憲
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.21, no.1, pp.1-11, 2017-04-30 (Released:2017-09-12)
参考文献数
37

The aim of this paper is to clarify the relationships among the phrase final tones of questioning utterances, the pragmatic factor, and the linguistic factor. We extracted questioning utterances from 54 conversations by 25 speakers and classified them according to the degree of information request and the sentence final particles. Tones were classified into the five tones based on its acoustic features. The main findings of the study are shown as below. The relationships between the rising tone and the pragmatic factor are coordinating. The relationships between the rising tone and the linguistic factor are complementary.
著者
劉 超然 石井 カルロス寿憲 石黒 浩 萩田 紀博
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.2, pp.112-121, 2013 (Released:2013-01-17)
参考文献数
12
被引用文献数
1

A suitable control of head motion in robots synchronized with its utterances is important for having a smooth human-robot interaction. Based on rules inferred from analyses of the relationship between head motion and dialog acts, this paper proposes a model for generating head tilting and evaluates the model using different types of humanoid robots. Analysis of subjective scores showed that the proposed model can generate head motion with increased naturalness compared to nodding only or directly mapping people's original motions without gaze information. We also evaluate the proposed model in a real human-robot interaction, by conducting an experiment in which participants act as visitors to an information desk attended by robots. The effects of gazing control were also taken into account when mapping the original motion to the robot. Evaluation results indicated that the proposed model performs equally to directly mapping people's original motion with gaze information, in terms of perceived naturalness
著者
境 くりま 港 隆史 石井 カルロス寿憲 石黒 浩
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.3, pp.310-320, 2017-03-01

人間はわずかな感情や態度の変化を細かな動作の変化で表現することにより,対話相手に様々な感情や態度を伝達することができる.更にそれらが場の雰囲気を形成し,対話しやすさの促進などの効果をもたらす.人間に酷似したアンドロイドで人間同様に感情や態度を伝達するためには,感情の連続的な変化に対応するように動作特徴(動作の振幅や速度など)を変化させることができる動作生成手法が必要となる.人間では感情が身体の筋系に影響を及ぼして身体動作を変化させていることを踏まえると,筋系の振る舞いをモデル化した動作生成手法において,筋系のパラメータと感情状態を対応づけることで,上記のような動作生成手法が構築できると考えられる.本論文では,対話において常時現れる発話動作に着目し,著者らがこれまでに提案した音声駆動頭部動作生成システムのパラメータ空間と感情空間の対応関係を実験により明らかにした.このマッピングを用いて,感情の細かな変化を表現するように動作を変調することができる発話動作生成システムを提案する.
著者
石井 カルロス寿憲
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.10, no.3, pp.18-28, 2006-12-30
被引用文献数
2

日常対話音声の正しい理解や,対話における話者交替の制御,更には自然な対話音声の合成を行なうためには,韻律特徴の適切な操作は不可欠である。日本語では,句末の音調は,疑問・強い主張・意外性・促しなどの文のモダリティを表示する機能,フォーカスを表示する機能,大きな意味の区切りの表示,または発言がまだ終わっていないことを示す談話機能など,さますまな役割を持つ。また,句末に終助詞が付くか否かによって,句末音調がもたらす機能が変わる。本稿では,対話における話者交替の談話機能に焦点を当て,句末の形態素や品詞などの言語情報を考慮し,句末音調の役割について論ずる。自然会話音声データを用い,300ミリ秒以上のポーズで区切った発話区間の句末において,形態素と談話機能のラベルを付与し,音調を表す音響的特徴を抽出しか。分析の結果,多くの形態素では,句末音調と話者交替の談話機能に関連が見られたが,主に終助詞を含んだ一部の形態素では,関連が見られないことが示された。また,複数の品詞が同じ形態素で表現される場合があり,言語情報を用いる際の注意点について述べる。
著者
石黒 浩 平田 勝弘 小川 浩平 開 一夫 石井 カルロス寿憲 吉川 雄一郎 岩井 儀雄 西尾 修一 中村 泰 吉峰 俊樹 平田 オリザ 神田 崇行 宮下 敬宏 板倉 昭二 港 隆史 平田 雅之
出版者
大阪大学
雑誌
基盤研究(S)
巻号頁・発行日
2013-05-31

本研究は,従来の遠隔操作型アンドロイドやロボットを,さらに進化させ,今後主流になると予測される遠隔操作型ロボットの研究開発プラットフォームとして,半自律遠隔操作型アンドロイドやロボットの実現を目指した研究開発を展開した.具体的には次の課題について研究に取り組んだ.多様な相互作用が可能な半自律アンドロイドの開発.社会的存在としてのアンドロイドやロボットの機能開発.現実社会おけるアンドロイドやロボットの社会における実証実験.アンドロイドのブレインマシンインターフェース(BMI)による遠隔制御の研究.
著者
石井 カルロス 寿憲 石黒 浩 萩田 紀博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.106, no.178, pp.1-6, 2006-07-14
参考文献数
14
被引用文献数
1

「りきみ」(喉頭をりきんだ際に生じる声質)は,声帯の振動パターンに関連する声質の一種類である.りきみは,話者の感情や態度などのパラ言語情報をもたらすため,対話システムなどにおいて,りきみの自動検出を考慮することは重要と考えられる.本稿では,りきみの自動検出を目的とし,りきみの生成と知覚を考慮し,さまざまな音響特徴の分析を行った.自然対話より抽出したりきみ区間を分析した結果,まず周期性の不規則な特徴以外にも,りきみの知覚に影響する要因が存在することが分かった.喉頭のテンションに関連するスペクトル傾斜を表現したパラメータによる識別を試みた結果,りきみ発話の一部は表現できた.しかし,スペクトル解析により,鼻音化した母音とダブル・ビートの声帯音源が生じた場合に,スペクトル傾斜のパラメータが不適切であることを明らかにした.時間軸での分析を行った結果,非りきみのフライ発話では,diplophoniaが多く生じ,りきみ発話では,生じない傾向が観られた.この結果を基に,りきみの生成過程における議論を行った.