著者
高橋 勇希 小口 純矢 高道 慎之介 矢野 昌平 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2020-SLP-132, no.22, pp.1-3, 2020-05-30

音響インパルス応答(IR)の測定には,Maximal Length Sequence や Time Stretched Pulse などの測定信号の利用が一般的である.通常,被測定系に人間が含まれるかどうかは考慮されないため,これらの測定信号が人間に与える聴覚印象が無視されている.他方,新たな生体認証として,人間の外耳道の音響インパルス応答が提案されており,個人に応じた音メディア提示などへの応用が期待されている.この被測定系は人間の聴覚器官を含むため,受聴者の心理的ストレスが小さい測定信号を利用すべきである.そこで本研究では,人間にとって心地よいとされる自然環境音での IR 測定手法,クラウドソーシングを利用した主観評価と周波数分析を用いた評価指標を提案する.実験的評価結果より,(1) 測定信号としての妥当さと聴覚的な心地良さを両立する自然環境音が存在すること,(2) 板倉斎藤擬距離に基づく測定信号選定は,雑音環境下の高精度IR測定にあまり寄与しないことを明らかにする.
著者
高道 慎之介
出版者
一般社団法人 電気学会
雑誌
電気学会誌 (ISSN:13405551)
巻号頁・発行日
vol.141, no.2, pp.93-96, 2021-02-01 (Released:2021-02-01)
参考文献数
9

1.はじめにボイスチェンジャー(音声変換)とは,音声を人工的に加工・変換する技術である。ボイスチェンジャーという単語から読者の皆さまは何を想起するだろうか。ヘリウムガス,映画「キングコング」,アニメ「名探偵コナン」・「ドラえもん」,それともVTuber(Virtual YouTuber)だろ
著者
松永 裕太 佐伯 高明 高道 慎之介 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2022-SLP-140, no.31, pp.1-6, 2022-02-22

本論文では,個人性を再現する自発的な音声合成の実現に向けて,言語学的知識に基づいた包括的な実験的調査を行う.近年発展している音声クローニングは流暢な朗読発話に限定され,より人間らしい自発的な音声合成のための新たな音声クローニングの手法が求められている.そこで本論文は,声色の個人性のみならず非流暢性の個人性を再現可能な自発音声合成に取り組む.具体的には,主要な非流暢性であり,心理学や言語学の研究により発話生成やコミュニケーションにおいて重要な役割を果たすことが知られている,フィラーを扱う.本論文では,話者依存と話者非依存のフィラー予測手法を比較評価するため,多話者コーパスで学習した話者非依存のフィラー予測モデルを用いた音声合成手法を提案する.実験的評価により,フィラーの位置と種類の関連,自然性と個人性のトレードオフを明らかにし,人間らしい音声合成の実現への方向性を示す.
著者
高道 慎之介
出版者
一般社団法人 電気学会
雑誌
電気学会誌 (ISSN:13405551)
巻号頁・発行日
vol.141, no.2, pp.93-96, 2021

<p>1.はじめに</p><p>ボイスチェンジャー(音声変換)とは,音声を人工的に加工・変換する技術である。ボイスチェンジャーという単語から読者の皆さまは何を想起するだろうか。ヘリウムガス,映画「キングコング」,アニメ「名探偵コナン」・「ドラえもん」,それともVTuber(Virtual YouTuber)だろ</p>
著者
倉田 将希 高道 慎之介 佐伯 高明 荒川 陸 齋藤 佑樹 樋口 啓太 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2021-SLP-136, no.31, pp.1-6, 2021-02-24

本稿では,音声変換ユーザに目標話者のキャラクタ性を獲得して発話させるためのシステムを提案する.深層学習に基づくリアルタイム音声変換は,人間の発声器官の物理制約を超えて,ユーザの音声から所望のキャタクタ性を持つ音声への高精度な変換を可能にしつつある.しかしながら,音声のパラ言語情報(抑揚・強勢など)の変換は未だ困難であり,ユーザの音声のパラ言語情報が変換音声に直接的に反映されてしまう.また,通常の発話において,人間は自己聴取音の聴取との相互作用により自らの言語情報・パラ言語情報を制御するが,リアルタイム音声変換を用いた発話において,そのような相互作用をもたらす機構は存在しない.そこで本稿では,変換音声をユーザにリアルタイムにフィードバックする自己聴取音制御システムにより,変換音声に所望のキャラクタ性を付与するようユーザを発話変容させるシステムを提案する.実験的評価では,一人称視点(音声変換ユーザ視点)と三人称視点においてシステムおよび変換音声を評価し,(1) 演技経験の少ないユーザに対してシステムの有用性が高いこと,(2) F0 を目標キャラクタに近づけるだけで十分な発話変容効果がみられることを示す.
著者
中村 哲 須藤 克仁 松本 裕治 田中 宏季 サクリアニ サクティ 吉野 幸一郎 高道 慎之介
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(A)
巻号頁・発行日
2017-04-01

①-A)常時音声認識:音声、非音声音響モデルに基づく常時音声認識の検討を始めた。B)自動音声同時通訳:シフトリデュースパーザを音声認識に組み込み、逐次的に音声認識デコーダで構文解析しながら次の文構成要素を予測し、訳出、待機を行う方法の高度化について文献調査を行った。C)機械翻訳の高度化:再帰的ニューラルネットワークの一種であるLSTMによる注意形ニューラル機械翻訳(NMT)の高度化に向けて研究を進めた。D)対話制御:LSTMを用いた対話状態推定法の利用、POMDPを利用した音声翻訳の高度化に向けて検討を始めた。②パラ言語:元言語の発話から強調抽出し、アライメントを求めた後、CRFおよびLSTMニューラルネットで対象言語に強調を付与する技術の改良を進めた。③リアルタイムコミュニケーション:視線検出装置Tobi、モバイル心拍計などを用いてプロの同時通訳者の作業時、および同時通訳ユーザの聴取時の聴取負荷の観察を行うため、実験計画の検討を行った。④コーパス構築:2012年から介した基盤研究Aで収集したコーパスの整理を行い、H29年度に実施すべきコーパス収集の計画を検討した。
著者
大中 緋慧 高道 慎之介 井本 桂右 岡本 悠希 藤井 一貴 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2023-SLP-146, no.33, pp.1-6, 2023-02-21

オノマトペとは,音の構造を模倣する文字表現,つまり音の文字表現である.この観点から,所望のオノマトペから環境音を合成する Onoma-to-wave が提案されている.他方,オノマトペには漫画や広告,バーチャルリアリティにおける音の視覚的表現(画像オノマトペ)がある.画像オノマトペには,画像の伸縮などの文字だけでは表現できない表現が含まれており,この表現を用いることでより多様な音の合成が期待できる.そこで本研究は,画像オノマトペから環境音を合成する Visual onoma-to-wave を提案する.本手法は,画像オノマトペに含まれる視覚表現のみならず,環境音源の視覚表現(音源画像)を補助情報として,環境音を合成する.また本論文では,オノマトペの反復表現に着目したデータ拡張手法を提案し,より多様な環境音合成を可能にする.実験評価の結果から,画像オノマトペと音源画像から多様な環境音を合成できることが示す.
著者
コンヴェール マクシム 深山 覚 中野 倫靖 高道 慎之介 猿渡 洋 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-120, no.1, pp.1-8, 2018-08-14

ニューラルネットワークは自動和声付けにおいて有望な技術である.膨大なデータセットを元に,入力と出力の複雑な依存関係を学習することができるため,旋律と和音の依存関係も扱うことができる.ニューラルネットワークの性能はその入力と出力情報の表現方法が強く影響する.しかし,従来の自動和声付け研究では,出力情報である和音の表現方法について深くは検討されておらず,テンションノートといった和音の詳細な構造が最大限活用されてこなかった.和音の表現方法を変えることで,旋律と和音の関係を更に細かく学習できると考えられる.そこで本研究では,和音の表現方法の違いが Recurrent Neural Network (RNN) による自動和声付けの性能にどれほど影響するかを調査する.従来の表現方法を含む 4 つの異なる和音表現方法に基づいて Gated Recurrent Unit (GRU) を用いたニューラルネットワークを構築し,それらの性能を比較した.実験の結果,和音の構成音を陽に表現した表現方法を用いると,従来の和音ラベル形式を使った場合に近い性能に達成するだけでなく,構成音の細かな違いに対応できる多機能な自動和声付けモデルの構築を可能とすることがわかった.
著者
竹川 佳成 植村 あい子 奥村 健太 高道 慎之介 中村 友彦 平井 辰典 森尻 有貴 矢澤 櫻子
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.10, pp.1-6, 2016-07-23

「新博士によるパネルディスカッション」 は,音楽情報科学の研究に取り組んできた博士号を取得したばかりの方を集め,研究の紹介,博士課程進学の動機,博士課程在学中のドラマ,今後の抱負などについてパネル形式で議論する.本稿では,今回パネリストとして参加していただく 7 名の新博士を紹介する.
著者
中村 哲 松本 裕治 戸田 智基 サクリアニ サクティ Neubig Graham Duh Kevin 小町 守 高道 慎之介
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-05-31

同時通訳基本方式研究として、フレーズベース統計翻訳における右確率を用いた同時通訳方法により、翻訳単位を短くする方法、翻訳単位の長さを調整する手法を提案した。さらに、形態素情報を使って文を分割する方法、Tree-to-string翻訳での部分構文構造を考慮して分割する方法を提案して高精度化を実現。さらなる精度改善のため、訳文に単語順序の入れ替えが発生するかを予測するモデルを構築すると共に、ニューラル翻訳の実装、統計翻訳のリランキング、注意型ニューラル翻訳の研究を進めた。また、同時通訳コーパスとして日英合計約80時間、講義データの書き起こし約50時間、うち約22時間分の日英翻訳を完了した。
著者
高道 慎之介 穗刈 治英 島田 正治
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J94-A, no.6, pp.449-452, 2011-06-01

本論文では,オーディオ帯域相当(100 Hz~15 kHz)での頭部球モデルにおけるHRTFの複素ケプストラム処理による最小位相化の有効性の範囲について理論値と測定値を比較し,同時に測定したHRTFを全零モデルにより近似し,その零点分布からHRTFの最小位相性を検証した.その結果,理論値と測定値の比較によって最小位相化の有効性を検討するとともに,測定したHRTFは影耳となる方位角において非最小位相零点が増加することが明らかになった.