著者
池田 友和 大脇 渉 高橋 弘太
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-109, no.2, pp.1-6, 2015-10-31

スマートミキサーは,複数の入力信号を時間周波数平面に展開し,平面上の局所領域において非線形な混合処理を行うことで,使用者の優先させたい音を目立たせた混合出力を得ることのできる新しい音信号混合法である.従来のスマートミキサーは,音声と BGM の混合を対象とした局所的な処理であり,楽音同士の混合については検討されていなかった.本研究では,楽音同士の混合を対象として,スペクトルの全体構造に基づいた処理を行い,協和性理論を規範とし,調和の取れた混合出力を得るミキシング手法を提案する.提案手法でのミキシング結果を聴取実験と不協和度によって評価し,楽音同士の混合における,スペクトルの全体構造に基づいた処理の不協和感の緩和への有効性を確認した.その結果,440Hz 以下の半音音程の不協和な定常音について,不協和感の緩和効果があることが確認できた.
著者
吉原 亨 蔦木圭悟 高橋 弘太
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2008, no.123(2008-SLP-074), pp.233-238, 2008-12-02

できるだけ聞き落としを生じることなく,時間的な効率を上げて音声再生を行うためには,個々の音声に対して最適な再生速度を決定するための指標が必要となる.本稿では,この問題に関して得られた 2 つの成果について発表する.第一の成果は, 2 つの異なる狭帯域エネルギの時間変化に着目した話速推定法を提案し,正規化した誤差で 16% の推定精度で話速推定が行えることを示したことである.第二の成果は,通常発話の音声と高速発話の音声を,それぞれ極めて速い話速に話速変換した結果を観察し,高速発話を話速変換した音声が,より調波構造の乱れが少ないことを示したことである.本稿は,我々で製作している話速バリエーション型音声データベース (SRM-DB) を用いて行った.我々は本研究を SRV-DB の有効な利用法の一例として発表する.
著者
高橋 弘太
出版者
電気通信大学
雑誌
基盤研究(C)
巻号頁・発行日
2008

人間の聴覚特性に基づいて,最も聞き取り易い再生速度で音声を再生する手法について研究した.この研究では,第一に,話速が聴覚にあたえる影響の定量的研究,第二にその研究成果に基づいた再生速度決定アルゴリズムの研究とそのアルゴリズムを実証するためのシステム実装と実験の2つが大きな柱である.さらに,第三の柱として,この研究のために自前で製作する話速バリエーション型音声データベースをインターネットで公開し、音声分野の研究者に利用してもらい話速推定研究を啓蒙することがあげられる.3年間の期間で,これらを計画どおり実施した.
著者
若林 剛 高橋 弘太 岩倉 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.102, no.322, pp.29-34, 2002-09-13
被引用文献数
8

近年,独立成分分析を利用したブラインド音源分離が研究され,よい成果を納めている.過去のこれらの研究では,マイクロホン数2〜8個程度の小〜中規模アレイを用いるものがほとんどであり1マイクロホン数が100を超える大規模マイクロホンアレイへの適用は,まだあまり試みられていなかった.そこで本研究では,大規模マイクロホンアレイを前提とし,独立成分分析による信号分離を行った.本報告では2つの問題について取り上げる.第一に,音源数に対してマイクロホンの数が多い場合に,1つの信号が複数の独立成分に分離されるという問題である.マイクロホンアレイの大規模化ではこの問題がさらに顕著に現れる.この問題に対して,小〜中規模アレイと同様の手法が適用できるか検討した.第二の問題は,周波数領域でICAによる分離を行うと,分離信号が周波数間で入れ替わりが起きる,置換問題である.以上2つの問題を橡証するために,大規模化が容易なマイクロホンアレイシステムを作成し実環境の音声による分離宰験を行ったので,その結果についても報告する.
著者
高橋 弘太 蔦木 圭悟 吉原 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.337, pp.227-232, 2008-12-02
被引用文献数
2

高齢者に確実に音声を聞き取らせるには,どうしたらよいか,また健常者に対しては,短い時間でより多くの音声を聞き取らせるには,どうしたらよいか.これらの研究を行うためには,正確な時間管理のもと,同じ音声を同じ話者が話速を変えて発声した音声のデータベースが必要である.しかし,現時点では,そのような目的で大規模に作られた音声データベースは存在しない.そこで,我々は,平成20年度〜平成22年度の科研費の研究として,さまざまな話速で録音した音声データベースを構築している.今回は,このデータベースの紹介を行うとともに,会場で音声の研究者の生の意見やコメントをうかがって,今後のデータベース作りに反映させていきたいと考えている.また,我々は,音声データベース作成のために,話速を正確に管理しつつ録音できるシステム(原稿提示システム)も製作した.システムはパソコン上で動くもので,将来は,このソフトも公開して,電通大外でも音声を追加できるようにしたいと考えている.当日は,このシステムの機能と,どのような工夫がなされているかについても紹介したい.