著者
牧 勝弘 赤木 正人 廣田 薫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.60, no.6, pp.304-313, 2004-06-01
参考文献数
17
被引用文献数
1

中脳に位置する下丘中心核(Icc)において観察される複雑かつ多様な時間応答パターンの模擬が可能な計算モデルを提案する。Iccに関する生理学的,解剖学的実験報告に基づき,下位の神経核細胞(蝸牛神経核腹側核,又は外側毛帯核腹側核)からIcc細胞への興奮性入力とそれよりも時間的に遅れた抑制性入力という単純な神経回路により,計算モデルを構成する。モデルを用いたシミュレーションの結果,本計算モデルは,生理学的応答特性に基づいて詳細に分類されたIcc細胞の時間応答パターン,すなわち,chopper,pauser, sustained,onset,on-sustained型,及びそのサブタイプ全10種類を再現できることが分かった。この結果は,Iccにおいて観察される時間応答パターンは複雑かつ多様であっても,それを生じさせる神経回路は単純であるという可能性を示している。
著者
赤木 正人 羽二生 篤
出版者
日本音響学会
雑誌
日本音響学会論文集 (ISSN:18807658)
巻号頁・発行日
vol.2011, pp.1725-1728, 2011-03-02

機械による音声認識について,この数十年来数多くの手法が提案されてきた.しかし,まだ十分な性能は得られていない.本講演では,現状の音声認識装置ではこんなこと(もちろん人にとっては簡単なこと)は出来ないだろう,というものをならべたて,改めて人による音声知覚と機械による音声認識を対比してみることで,今後期待される音声認識のメカニズムを探る.
著者
齋藤 毅 辻 直也 鵜木 祐史 赤木 正人
出版者
Acoustical Society of Japan(日本音響学会)
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.64, no.5, pp.267-277, 2008-05-01

歌声特有の音響特徴量と歌声知覚の関係を検討するために,歌声らしさの知覚モデルを提案する。このモデルは,「歌声らしさという聴覚印象が複数の基本的な心理的特徴の知覚に起因する」という仮説のもと,歌声らしさと音響特徴量の対応関係の間に基本的な心理的特徴を介した3層で構成される階層構造モデルである。第1層(歌声らしさ)と第2層(基本的な心理的特徴)の関係については,多次元尺度構成法と重回帰分析によって調査した。第2層と第3層(音響特徴量)の関係については, STRAIGHTを用いた音響分析・合成と心理物理実験によって調査した。その結果, "揺れ," "響き"といった基本的な心理的特徴が歌声らしさの聴覚印象に大きく寄与しており,両者の聴覚印象には基本周波数の準周期的な振動成分であるヴィブラートとそれに同期したホルマントの振幅変調成分,及び3kHz付近の顕著なスペクトルピーク成分と同帯域の強い高調波成分がそれぞれ寄与していることが明らかとなった。更に,これらの音響特徴量を話声に付与することで歌声らしさの聴覚印象が向上する結果を得た。以上から,歌声らしさの知覚モデルを構築することで,歌声知覚における歌声特有の音響特徴量の役割について詳細に検討することが可能であることを示した。
著者
平館 郁雄 赤木 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.744, pp.43-50, 2002-03-21
参考文献数
10
被引用文献数
2

本研究では、怒りの感情音声における音響特徴量(基本周波数・パワー・持続時間・フォルマント周波数・スペクトル)と聴覚印象との関係を調べることを目的とする。本稿では、扱う感情を「Cold Anger(押し殺した怒り)」「Hot Anger(激しい怒り)」とし、「Neutral(平静)」音声との音響特徴量の比較を基に、音響特徴量の変動が大きいと考えられるアクセント部の分析を行った。その結果、感情間でいくつか相違が見られた。((1)基本周波数・パワーに関しては、「Hot Anger」のアクセントレベル上昇時の変化率が最も大きい。(2)「Cold Anger」のアクセント部の母音の持続時間が最も短い。(3)フォルマント周波数に関しては「Hot Anger」は「Neutral」より高い。(4)スペクトルに関しては「Hot Anger」における高帯域で強調されている。)そして、分析結果から感情音声の合成音を作成するための規則を導出した。
著者
赤木 正人
出版者
日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.66, no.8, pp.393-398, 2010-08-01

音声対話などの音声によるコミュニケーションでは,「何を話しているか」という言語情報だけではなく,これ以外の情報,例えば個人性(性別,年齢),感情・健康状態,声質などの言語以外の情報が多数送受される。これらの情報を多分に含む音声は,Expressive Speech と呼ばれている。音声によるコミュニケーションでは,言語情報だけではなくこれらの情報にも重要な役割が含まれていると言われており,音声対話の精緻な解析のためには,これら双方を考慮する必要がある。本稿では,工学よりの目的(機械による感情の認識)を設定した上で,音声及び聴覚分野においてこれまでに得られた言語以外の情報の知覚に関する知見を取り混ぜながら,機械による感情の認識という目的に向かうための基本的考え方をどのように構成すれば良いかについて,思想まで踏み込んで解説する。
著者
牧 勝弘 赤木 正人
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.55-64, 2011-02-01 (Released:2017-06-02)
参考文献数
15

聴神経の発火頻度は,音の立ち上がりに対して高く,その後急速に低下する(順応)。この順応は音圧レベルの影響を強く受け,その特性は個々の聴神経で大きく異なっている。従来のモデルは,順応の音圧レベル依存の性質を模擬できず,複数の聴神経の順応特性を模擬することができなかった。本研究では,内有毛細胞の受容器電位の生成機構について新しい機能モデルを提案し,従来の内有毛細胞モデルとパルス列を出力する聴神経モデルを組み合わせることで聴覚モデルを構築した。モデルの出力を生理データと比較することでモデルの評価を行い,本モデルが,複数の聴神経の順応特性を,音圧レベル依存の性質まで含めて定量的に模擬できることを示す。
著者
高橋 響子 赤木 正人
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-123, no.24, pp.1-4, 2019-06-15

歌声には,喉頭および口腔内で生じる乱流雑音が多い.そのため,音声生成過程の数理モデルによる歌声の声道共鳴特性および声帯音源特性の推定は困難であった.本研究では,歌声生成過程の解明に向け,乱流雑音を含む歌声の声帯音源波形と声道共鳴特性の同時推定法を提案する.推定される声道共鳴特性の安定性を保つために,声道共鳴特性は声帯音源特性に比較してゆっくりと変化するという仮定のもと声道共鳴特性を推定した.歌声のシミュレーション波形をデータとして用いた分析実験により,乱流雑音が声帯音源に含まれる歌声において,声帯音源波形と声道共鳴特性が同時推定可能であることが確認された.
著者
赤木 正人 水町 光徳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.178, pp.1-8, 1997-07-18
被引用文献数
3

本報告では、マイクロホン対を用いて時間・周波数が局在した雑音を推定し、推定した雑音を引きさることによって信号音を浮かび上がらせる手法を提案する。これと同様の考え方を基にした方法としてGrifiths-Jim型のビームフォーマがあるが、適応フィルタの収束が遅いため、到来方向が変化する雑音とか突発的な雑音には対処できない。また、雑音と信号音は無相関であることを仮定しているため、残響などで相関が存在すれば、信号音が歪むなどの問題がある。一方本手法は、雑音をモデル化しできる限り解析的に抽出することによって、この問題を回避し、雑音を取り去っている。主マイクロホン2本と補助マイクロホン1本を用いた場合の性能評価の結果、合成波形を用いたシミュレーションの場合SN比が10〜20dB向上し、実環境では雑音が含まれない信号音との対数スペクトル距離が約5dB減少した。
著者
齋藤 毅 後藤 真孝 鵜木 祐史 赤木 正人
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.25-32, 2008-02-08
被引用文献数
7

本稿では,歌詞の朗読音声(話声)を歌声に変換する歌声合成システムSingBySpeakingについて述べる.このシステムは,音声分析合成系STRAIGHTによる分析/合成処理過程において,基本周波数(F0),スペクトル,音韻長を制御するモデルによって歌声特有の音響特徴を操作することで話声を歌声に変換する.F0 制御モデルは,楽譜情報から得られるメロディの遷移の概形に対して,4種類の動的変動成分(オーバーシュート,ヴィブラート,プレパレーション,微細変動)を付与することで歌声のF0変化パターンを生成する.スペクトル制御モデルは,話声のスペクトルに対して,歌唱ホルマントとヴィブラートに同期したホルマントの振幅変調を付与することで歌声のスペクトル形状を生成する.音韻長制御モデルは,楽曲のテンポに基づいて,話声中の各音韻長を歌声の音韻長に伸長する.システムで合成された音声を聴取実験によって評価した結果,各種音響特徴を制御することで話声から歌声に変換され,すべての特徴を制御した合成音の音質は原音声と同程度であることを示した.This paper describes a novel singing voice synthesis system SingBySpeaking that can synthesize a singing voice, given a speaking voice reading the lyrics of a song and its musical score. The system is based on the speech manipulation system STRAIGHT and comprises three models controlling three acoustic features unique to singing voices: the fundamental frequency (F0), phoneme duration, and spectrum. Given the musical score and its tempo, the F0 control model generates the F0 contour of the singing voice by controlling four types of F0 fluctuations: overshoot, vibrato, preparation, and fine fluctuation. The duration control model lengthens the duration of each phoneme in the speaking voice by considering the duration of its musical note. The spectral control model converts the spectral envelope of the speaking voice into that of the singing voice by controlling both the singing formant and the amplitude modulation of formants in synchronization with vibrato. Experimental results show that the proposed system can convert speaking voices into singing voices whose naturalness is almost the same as actual singing voices.
著者
赤木 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.78, no.5, pp.450-453, 1995-05-25
被引用文献数
8
著者
水町 光徳 赤木 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.82, no.4, pp.503-512, 1999-04-25
被引用文献数
32

本論文では, マイクロホン対で受音した雑音が含まれる信号から雑音のスペクトルを解析的に推定し, スペクトルサブトラクション(SS)を用いて受音信号のスペクトルから雑音スペクトルのみを減算する雑音除去法を提案する. マイクロホンアレーを用いた雑音除去法としては, 適応処理を用いた手法が主流であるが, 本手法は雑音の推定に関して解析的に構成する減算形アレーを使用する. このため, 本手法は演算量が少なく, しかも雑音の経時変化に対する雑音除去能力低下が生じ難いという性質をもつ. そして, 従来のSSは定常雑音の除去を目的としているが, 本手法では時々刻々雑音スペクトルの推定を行うため, 突発性雑音の除去も可能である. 本雑音除去法の性能を評価するため, 雑音除去の計算機シミュレーション, 並びに残響の少ない実環境での雑音除去実験を行い, 雑音によりスペクトル包絡に生じたひずみが低減できることを確認した.
著者
柴田 武志 赤木 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.551, pp.117-122, 2008-03-13

本稿では,連続発話音声中に含まれる音響特徴量を静的な特徴,および動的な特徴に分類し,これらがどのような順序で男声・女声知覚に寄与しているか明らかにすることを目的とする,(1)声質変換モデルを用いて連続発話音声から静的特徴および動的特徴を表すパラメータ値を抽出する.(2)各パラメータ値が男声・女声で違いがあるかどうかを確かめるためにMDSによるパラメータ値の分析を行う.(3)MDS分析によって,違いが見られた特徴量を表すパラメータ値が男声・女声知覚にどう影響を与えているかどうかを調べるために,パラメータ値を平均した平均音声と,男声・女声の静的特徴,および,動的特徴を表すパラメータ値とを入れ替えた音声を合成し,男声・女声を判別する聴取実験を行った.その結果,男声・女声知覚には静的特徴である平均基本周波数とスペクトル包絡が大きな影響を与えており,次いで,動的特徴である基本周波数の変化と音韻長が影響を与えており,スペクトルの変化とゲインのダイナミックレンジはあまり影響を与えていないことが明らかになった.