著者
彦坂健太郎 谷口 徹 誉田 雅彰 白井 克彦州
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.133, pp.19-24, 2006-12-15
被引用文献数
2 1

本研究では,ユーザに煩わしい操作を要求することなく,ユーザの好みに合わせた自動的に選曲を行うシステムの開発を目指し,主観的な好みと楽音の音響的特徴との関連性を基にユーザの気分に適合する楽曲を楽曲再生時のオンライン学習により適応的に選択する手法を提案する.具体的にはユーザがある楽曲を「聴きたくない」としたときに特徴量空間においてそれらの楽曲からの距離が遠い楽曲を選曲するアルゴリズムを適用する.今回実験によって従来のランダム再生と比較しこの手法が有効であることが確認された.In this research, we are aiming for development of a music selection system adapted for user's feeling without disturbing operation. We propose an adaptive automatic music se lection method based on the relationship between the acoustic features of music and the subjective user feeling. Concretely, when a user makes a decision that they don't want to lis ten some music, we apply an algorithm that choose a music which is furthest from the music. In this paper, we could confirm efficacy of this means compare with random selection.
著者
福井 孝太郎 石川 優馬 大野 圭介 榊原 菜々 高西 淳夫 誉田 雅彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.265, pp.19-24, 2008-10-16
参考文献数
6

人間の発声器官の3次元機械モデルの確立を目的としたWaseda Talkerシリーズの開発において,音声生成の明瞭性の向上を目的とした新型発話ロボットWT-7R(Waseda Talker No.7 Refined)を開発した.これまでの3次元発話ロボットWT-7においては,舌部をリンク機構で構築し,その上に熱可塑性エラストマー・セプトン製のカバーをかぶせることで声道としていた.しかし,この方法ではカバーが十分な厚みが無いため音漏れが生じ,共鳴特性に問題があるため,結果として,生成される母音が不明瞭になってしまっていた.この問題を解決するために,新型ロボットでは,リンクが駆動する舌内部の空間を液体で満たすことにより,共鳴特性の向上を目指すこととした.実験による検討の結果,セプトンへのダメージが少ないという利点から,封入液体にはエチレングリコールを選定し,可動部ではオイルシールや液体ガスケットによって液漏れを防いでいる.また,WT-7においては舌のリンク自体の可動域が不足していたため改良を行い,口唇部においては断面積変化が不十分であったため,確実に必要な断面積変化を実現できる機構を採用した.これらの改良により,発話ロボットによって生成される母音の明瞭性が向上し,スペクトル解析で計測したフォルマントのバンド幅が狭くなっていることが確認できた.
著者
誉田 雅彰 池永 剛
雑誌
情報処理
巻号頁・発行日
vol.57, no.8, pp.738-743, 2016-07-15

2019年のラグビーW杯や,2020年の東京オリンピックなどのビッグイベントの日本開催を契機として,スポーツへの関心が高まっている.一方,近年のスポーツ分野における情報処理技術が果たす役割は,スポーツ動作解析をはじめとしてゲームの戦略分析やコーチング分野などにも広がりを見せている.それらは,トップアスリートの競技力向上に資するだけでなく,最近のスマートフォンによるランニングアプリに見られるような一般人の健康スポーツにも広がっている.本稿では,球技スポーツを対象としたスポーツ映像処理とセンサ技術を利用した自動コーチングシステムについて,技術的現状と課題について解説した.
著者
福井 孝太郎 草野 世大 高西 淳夫 誉田 雅彰
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.14, no.2, pp.57-64, 2010-08-30
被引用文献数
1

This paper describes a mechanical talking robot that resembles human speech production aparatus and its control mechanism. The talking robot, Waseda Talker, has mechanical replicas of the vocal folds, tongue, jaw and lips, and it is capable of producing vowel and consonant sounds in a human-mimetic manner. The source sounds are produced by airflow from the lungs to the glottis, and the resonance characteristics of the vocal tract are controlled by changing geometries of the articulators. Each component organ in the talking robot has many degrees of freedom and requires a high-level control design to realize continuous speech. A new control method based on articulatory motion data obtained from electromagnetic articulography (EMA) is presented together with experimental results from continuous speech synthesis using the most recent model of the robot.
著者
福井 孝太郎 新宅 英滋 下村 彰宏 榊原 菜々 石川 優馬 誉田 雅彰 高西 淳夫
出版者
The Robotics Society of Japan
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.26, no.7, pp.794-800, 2008-10-15
参考文献数
11

We have developed a vocal control method based on forward and inverse model, and new vocal cord mechanism, for anthropomorphic talking robot, Waseda Talker No.7, to produce various kinds of voices. The previous artificial vocal cord model could reproduce human-like vibration, however, the control range of the acoustic parameters are very small. We developed new mechanism could adjust the vocal cords tension effectively and control the glottal opening-closing, to broaden the control range. The control parameters of the vocal cords on WT-7 are vocal cord tension, glottal opening and air pressure, and the acoustic parameters are sound pitch, spectrum tilt and sound pressure. The relations between these parameters are complicated, and hard to modeling. The learning process consists of learning of the NN forward model and learning of the inverse model by using the forward model. In addition, the real-time auditory feedback mechanism is used to reduce the error. By this method, the acoustic parameters could be followed well the target.
著者
白井 克彦 誉田 雅彰
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:03736091)
巻号頁・発行日
vol.J59-A, no.8, pp.668-674, 1976-08-25

調音運動に関する研究は,音声伝送,音声合成,音声認識の基礎として,音響次元での処理を調音運動の特性に応じた適切なものとする意味から重要であり,その手段として調音機構に関する適当なモデルを設定することが有用である.本論文では,各調音器官の構造性を考慮した調音モデルの構成方法について述べた.このモデルの特徴は,側面X線写真データの統計的な分析によって得られる舌面の変形に関しての主要な変動要因を用いて舌を表現している点であり,従来のモデルと同程度のパラメータでより精密な調音状態の記述が可能となる.次に,このモデルを用いて調音パラメータと音響次元との対応関係を定量的に調べ,その応用として非線形重回帰分析の手法を用いた調音パラメータの推定方法を述べた.ホルマント周波数を用いて,合成音声と実音声について推定した結果は十分妥当なものであり,本方法の有効性を示している.
著者
白井 克彦 誉田 雅彰
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:03736091)
巻号頁・発行日
vol.J61-A, no.5, pp.409-416, 1978-05-25

調音器官の構造に基づいて,声道形を表現する調音モデルを設定し,音声波からモデルマッチングの手法によって,調音状態を推定する方法について述べる.この方法では,音声スペクトルに関して,設定されたモデルの適合誤差を最小にすることを基本とした非線形最適化問題として,調音パラメータが推定される.その場合,解の唯一性や収束の安定性が問題となるが,調音パラメータの変動範囲および分析フレーム間の連続性の制約を評価関数に取入れること,声道特性の分離基準としてモデルの特性を考慮すること,適切な初期値の設定などによって,二,三回の反復計算により十分安定に解が求まることが,合成分析実験により明らかになった.更に,本方法を実音声に適用し,良好な結果が得られることを確認した.
著者
西川 員史 林 宏樹 桑江 俊治 棚橋 邦浩 信 英明 持田 岳美 誉田 雅彰 高西 淳夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.248, pp.17-22, 2002-07-19
参考文献数
10
被引用文献数
1

本研究は,人間の発声運動を模擬した人間形発話ロボットを用いて,人間の発声メカニズムをロボット工学的な視点から明らかにすることを目的としている.著者らは人間に近い自然な発声を目指し,昨年までの問題点を改良した新型発話ロボットWT-2(Waseda Talker-No.2)を開発した。WT-2は肺,声帯,口腔及び鼻腔からなる全15自由度の制御機構を有し,声道長は約175mmと人間と同程度の大きさを持つ.昨年までに開発したWT-1,WT-1Rと比べ,より柔軟な舌形状変更機構と,唇・鼻孔以外からの音漏れ低減により,明瞭性の高い母音及び破裂子音,摩擦子音,鼻子音の生成を実現した.