著者
山本 竜太 金只 直人 水町 光徳
出版者
産業応用工学会
雑誌
産業応用工学会論文誌 (ISSN:21875146)
巻号頁・発行日
vol.1, no.2, pp.52-57, 2013
被引用文献数
5

In this paper, sound quality of high resolution audio (HRA) is investigated in the view point of auditory perception. Perceptual characteristics of HRA have been examined by listening tests compared with the standard audio CD and the compressed MPEG audio layer-3 (MP3) qualities. The listening tests were carried out by the paired comparison, and the participants were asked to discriminate among HRA, CD, and MP3. Jazz music was selected out as the original HRA. Both CD and MP3 quality audio files were prepared from the original HRA file by the authors. It is found that the participants prefer the audio format with richer information, that is, HRA is most desirable and CD is better than MP3. The questionnaires filled in by participants indicate that subjective characteristics of HRA include much presence, high spatial clarity, and wide spaciousness. Additionally, perceptual discrimination in quantization distortion is also focused on in between 16 bits and 24 bits resolution. As the result of the listening test with 28 participants, the difference of the quantization resolution was discriminated with the accuracy of 60.3 %. Concerning the perceptual discrimination of HRA, quantization resolution is an important factor as well as its wide frequency range.
著者
山本 竜太 金只 直人 水町 光徳
出版者
一般社団法人 産業応用工学会
雑誌
産業応用工学会論文誌 (ISSN:2189373X)
巻号頁・発行日
vol.1, no.2, pp.52-57, 2013 (Released:2016-09-01)
参考文献数
8
被引用文献数
5

In this paper, sound quality of high resolution audio (HRA) is investigated in the view point of auditory perception. Perceptual characteristics of HRA have been examined by listening tests compared with the standard audio CD and the compressed MPEG audio layer-3 (MP3) qualities. The listening tests were carried out by the paired comparison, and the participants were asked to discriminate among HRA, CD, and MP3. Jazz music was selected out as the original HRA. Both CD and MP3 quality audio files were prepared from the original HRA file by the authors. It is found that the participants prefer the audio format with richer information, that is, HRA is most desirable and CD is better than MP3. The questionnaires filled in by participants indicate that subjective characteristics of HRA include much presence, high spatial clarity, and wide spaciousness. Additionally, perceptual discrimination in quantization distortion is also focused on in between 16 bits and 24 bits resolution. As the result of the listening test with 28 participants, the difference of the quantization resolution was discriminated with the accuracy of 60.3 %. Concerning the perceptual discrimination of HRA, quantization resolution is an important factor as well as its wide frequency range.
著者
屏 貴文 田中 裕人 水町 光徳 中藤 良久 松井 謙二
出版者
一般社団法人 産業応用工学会
雑誌
産業応用工学会全国大会講演論文集 2013 (ISSN:2424211X)
巻号頁・発行日
pp.24-25, 2013 (Released:2018-04-10)
参考文献数
3

近年,喉頭摘出者のための電気式人工喉頭(以下電気喉頭)による音声の音質改善の検討が行われており,中村らにより肉伝導人工音声によるコミュニケーション支援システムが提案されている。現在我々は,電気喉頭を用いて発声された音声をマイクで収音し,スピーカで拡声する発声補助システムを検討している。本稿では,電気喉頭音声よりも音質の良い音源の検討を行った。ケプストラム分析により声道特性を比較するとRosenberg波音源が低域でも通常の声帯振動に近い音源であることがわかった。また,ケプストラムのケフレンシー幅に着目し,声帯特性を比較するとRosenberg波の声帯特性が最も通常発声のケフレンシー幅に近く,約96%の幅であった。以上のことより,電気喉頭の音源にRosenberg波を用いることで,電気喉頭音声の音質の改善が行える可能性があることがわかった。
著者
屏 貴文 田中 裕人 水町 光徳 中藤 良久 松井 謙二
出版者
一般社団法人 産業応用工学会
雑誌
産業応用工学会全国大会講演論文集
巻号頁・発行日
vol.2013, pp.24-25, 2013

近年,喉頭摘出者のための電気式人工喉頭(以下電気喉頭)による音声の音質改善の検討が行われており,中村らにより肉伝導人工音声によるコミュニケーション支援システムが提案されている。現在我々は,電気喉頭を用いて発声された音声をマイクで収音し,スピーカで拡声する発声補助システムを検討している。本稿では,電気喉頭音声よりも音質の良い音源の検討を行った。ケプストラム分析により声道特性を比較するとRosenberg波音源が低域でも通常の声帯振動に近い音源であることがわかった。また,ケプストラムのケフレンシー幅に着目し,声帯特性を比較するとRosenberg波の声帯特性が最も通常発声のケフレンシー幅に近く,約96%の幅であった。以上のことより,電気喉頭の音源にRosenberg波を用いることで,電気喉頭音声の音質の改善が行える可能性があることがわかった。
著者
山本 一公 中村 哲 武田 一哉 黒岩 眞吾 北岡 教英 山田 武志 水町 光徳 西浦 敬信 藤本 雅清
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.75, pp.101-106, 2003-07-18
被引用文献数
26 4

本稿では,SLP雑音下音声認識評価ワーキンググループの活動成果として,雑音 下音声認識評価用共通データベースAURORA-2Jと,その標準評価スクリプトによるベースライン評価結果について述べる.AURORA-2Jは,AURORAプロジェクトの AURORA-2データベースの日本語版として設計され,標準評価スクリプトも AURORA-2で配布されているスクリプトをベースとして開発されている.この共通 評価フレームワークにより,各機関における雑音環境下音声認識手法の性能を容 易に比較することが可能となり,雑音環境下音声認識手法の発展を促すことがで きると考えられる.また,自動車内における数字/コマンド発声データベースで あるAURORA-3Jの開発進捗状況についても述べる.This paper introduces a common database, an evaluation framework, and its baseline recognition result for noisy speech recognition, AURORA-2J, as an outcome of IPSJ-SIG SLP Noisy Speech Recognition Evaluation Working Group. AURORA-2J is designed as Japanized version of the AURORA-2 database and the evaluation framework is based on the AURORA-2 baseline scripts. This common evaluation framework enables to compare various noisy speech recognition techniques on a common ground. We hope more development of noisy speech recognition techniques using this evaluation framework. We also describe about AURORA-3J, digits and speech command database in car environments.
著者
赤木 正人 水町 光徳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.178, pp.1-8, 1997-07-18
被引用文献数
3

本報告では、マイクロホン対を用いて時間・周波数が局在した雑音を推定し、推定した雑音を引きさることによって信号音を浮かび上がらせる手法を提案する。これと同様の考え方を基にした方法としてGrifiths-Jim型のビームフォーマがあるが、適応フィルタの収束が遅いため、到来方向が変化する雑音とか突発的な雑音には対処できない。また、雑音と信号音は無相関であることを仮定しているため、残響などで相関が存在すれば、信号音が歪むなどの問題がある。一方本手法は、雑音をモデル化しできる限り解析的に抽出することによって、この問題を回避し、雑音を取り去っている。主マイクロホン2本と補助マイクロホン1本を用いた場合の性能評価の結果、合成波形を用いたシミュレーションの場合SN比が10〜20dB向上し、実環境では雑音が含まれない信号音との対数スペクトル距離が約5dB減少した。
著者
松井 謙二 中藤 良久 水町 光徳 加藤 弓子
出版者
大阪工業大学
雑誌
基盤研究(C)
巻号頁・発行日
2012-04-01

喉頭がんなどにより発声困難になった方々が用いる電気式人工喉頭に関して、まず、手首や指のわずかな動きで抑揚を制御できるインタフェースを開発し、次に、装置を小型軽量化して手で保持することなく首に安定して装着可能な構造の人工喉頭を試作した。これらの結果を用いて、トータルシステムのユーザー評価実験を行った結果、新しい発声支援装置として使用が可能と思われるとの良好な評価結果が得られ、装置の有効性が確認できた。
著者
水町 光徳 赤木 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.82, no.4, pp.503-512, 1999-04-25
被引用文献数
32

本論文では, マイクロホン対で受音した雑音が含まれる信号から雑音のスペクトルを解析的に推定し, スペクトルサブトラクション(SS)を用いて受音信号のスペクトルから雑音スペクトルのみを減算する雑音除去法を提案する. マイクロホンアレーを用いた雑音除去法としては, 適応処理を用いた手法が主流であるが, 本手法は雑音の推定に関して解析的に構成する減算形アレーを使用する. このため, 本手法は演算量が少なく, しかも雑音の経時変化に対する雑音除去能力低下が生じ難いという性質をもつ. そして, 従来のSSは定常雑音の除去を目的としているが, 本手法では時々刻々雑音スペクトルの推定を行うため, 突発性雑音の除去も可能である. 本雑音除去法の性能を評価するため, 雑音除去の計算機シミュレーション, 並びに残響の少ない実環境での雑音除去実験を行い, 雑音によりスペクトル包絡に生じたひずみが低減できることを確認した.
著者
宮崎 健 水町 光徳 二矢田 勝行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.265, pp.47-52, 2008-10-16

我々の目的は,高齢者音声の様々な聴覚的特徴に対応する音響的特徴を体系的に明らかにする事である.本稿では,その前段階として高齢者音声の聴覚的特徴を体系的に示すために,高齢者音声の特徴を形容する語を選定した.最初に辞書等の情報を基に声の特徴を表す様々な語301語を列挙した後,アンケートと聴取実験を実施し,その結果を統計的手法により解析する事で,高齢者音声の特徴形容語を男性の場合10語,女性の場合11語選定した.次に考察として,高齢者音声らしさを端的に表す聴覚的特徴を,聴取実験結果に基づく因子分析及び重回帰分析を実施して調べたところ,「しゃがれ声(雑音系)」,「不明瞭さ(減り張りの無さ)」,「発話の遅さ」の3因子が男女共に抽出され,「しゃがれ声(雑音系)」が高齢者音声の知覚に最も関係が深いという結果を得た.