著者
板倉 文忠
巻号頁・発行日
1972-11-04 (Released:2009-12-16)

名古屋大学博士学位論文 学位の種類:工学博士(論文) 学位授与年月日:昭和47年11月4日
著者
板倉 文忠
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日
vol.3, no.3, pp.3_25-3_30, 2010-01-01 (Released:2010-10-01)
参考文献数
6
被引用文献数
1

音声信号に対する最も重要な分析方式であるLSP(線スペクトル対)発明の経緯について述べる.PARCOR(偏自己相関)係数方式及びLSP方式は,音声の周波数スペクトル,すなわち声道(口の形)を表現する方法である.これらの方式はいずれも世界中の携帯電話で使われ続けている.PARCOR方式及びLSP方式は,それぞれ,1969年,1975年に日本電信電話公社電気通信研究所(通研)において発明された.本稿では,これらの方式の誕生の経緯を明らかにするために,その出発点(1966年)となった最ゆうスペクトル推定法による音声分析合成方式(ML方式と略す)までさかのぼって紹介する.
著者
嵯峨山 茂樹 板倉 文忠
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J83-A, no.11, pp.1244-1255, 2000-11-25

線形予測符号化(LPC)分析と複合正弦波モデル化(CSM)分析の間にあるエレガントな関係(ここではこれを対称性と呼ぶ)について述べる.目的は,LPC,PARCOR,CSM,線スペクトル対(LSP)などの音声スペクトルモデル化の理論に統合的な視点を与えることにある.これらの分析法はいずれもモデルの自由度に等しい個数の低次の自己相関関数を与えられたとき,モデルのパラメータを求める問題となっているが,LPCもCSMも,直交多項式の理論の観点から見ると,音声のパワースペクトル密度関数を重み関数として定義される単位円周上の直交多項式の理論(LPCの場合)及び実軸上の直交多項式の理論(CSMの場合)であり,定式化,各種のパラメータの定義,解法アルゴリズムなどに関して美しい対称性が成り立つ.また,直交多項式の観点からLSPに対して新しい解釈を与える.
著者
引地 孝文 小坂 直敏 板倉 文忠
雑誌
情報処理学会研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2001, no.16(2000-MUS-039), pp.35-42, 2001-02-22

本研究では、笙の物理モデル構築を目的としている。フリーリード振動に関する文献で用いられた定式化を参考に星の物理モデルを構築し、時間領域シミュレーションを行う。また、人工吹鳴装置を用いて実際の楽器のリード振動、管内圧力、発振閾値圧を実測する。管長と発振閾値圧、管長と発音周波数、吹鳴圧と発音周波数等の関係について、実測値とシミュレーション結果を比較する。その結果、管長と閾値圧及び発音周波数について類似した傾向が見られた。吹鳴圧と発音周波数についてはやや異なる結果となった。また、電のリードは、クラリネットやオルガンのリードパイプとは異なり外向き発振をしているという結論が得られた。
著者
嵯峨山 茂樹 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.83, no.11, pp.1244-1255, 2000-11-25
参考文献数
26
被引用文献数
3

線形予測符号化(LPC)分析と複合正弦波モデル化(CSM)分析の間にあるエレガントな関係(ここではこれを対称性と呼ぶ)について述べる.目的は, LPC, PARCOR, CSM, 線スペクトル対(LSP)などの音声スペクトルモデル化の理論に統合的な視点を与えることにある.これらの分析法はいずれもモデルの自由度に等しい個数の低次の自己相関関数を与えられたとき, モデルのパラメータを求める問題となっているが, LPCもCSMも、直交多項式の理論の観点から見ると, 音声のパワースペクトル密度関数を重み関数として定義される単位円周上の直交多項式の理論(LPCの場合)及び実軸上の直交多項式の理論(CSMの場合)であり, 定式化, 各種のパラメータの定義, 解析アルゴリズムなどに関して美しい対称性が成り立つ.また, 直交多項式の観点からLSPに対して新しい解釈を与える.
著者
佐藤 奨 坂野 秀樹 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.97, pp.41-46, 2011-06-16

本研究は,楽曲推薦の特徴量に利用出来るような音響特徴量,特にラウドロック系の楽曲を特徴付ける音響特徴量の提案をする.ラウドロック系の楽曲は,歪んだ音を出すエレキギター及びベース,激しく叩くドラムの音が特徴的であり,上記の楽曲と,それ以外の楽曲とを混在させた曲順で聴くことはほとんどない.よって,両者を分類できる特徴量は,有用な特徴量となることが期待できる.本稿では,提案した音響特徴量を用いて,ラウドロック系,J-pop,ニューエイジ系の自動ジャンル分類実験により客観評価を行った.最も良い条件の場合,ラウドロック系の楽曲とそれ以外の楽曲とを区別する2ジャンルの識別率が97%,3ジャンルの識別率が87%となった.さらに,この音響特徴量が楽曲の印象とどのような対応があるのか,印象尺度を用いた主観評価実験を行った.その結果,音響特徴量と「激しい」「騒々しい」「優しい」といった印象との間に,強い相関があることが確認され,提案する音響特徴量が,主観的尺度と対応することが明らかになった.
著者
坂野 秀樹 武田 一哉 鹿野 清宏 板倉 文忠
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌A (ISSN:09135707)
巻号頁・発行日
vol.J81-A, no.2, pp.261-268, 1998-02

スペクトル包絡と音源の独立操作により, ある話者の音声を別の話者へと連続的に変化させる音声モーフィングを提案する.本手法では次の手順で音声モーフィングを実現する.1)時間領域におけるDPマッチングにより単位波形の対応をとる.2)単位波形をスペクトル包絡と音源に分離する.3)周波数領域のDPマッチングにより周波数軸を非線形に伸縮し, スペクトル包絡間の対応付けを行う.4)スペクトル包絡および音源の補間を行う.5)位相情報を付与し, 単位波形を得る.6)PSOLA法により合成する.この手法を用いることによって自然音声の時間的変化に比較的近い補間が可能となり, 音声の調音結合部分をモーフィングにより生成する実験を行った結果, ケプストラム距離において従来法に比べ1.9dBひずみを減少させることができた.また, 対比較試験では男性から女性へのモーフィングにおいて89%, 女性から男性へのモーフィングでは93%の割合で本手法の方が品質が良いと判断されており, 本手法の有効性が示された.
著者
伊藤 太介 武田 一哉 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.325, pp.59-64, 2001-09-21
参考文献数
10
被引用文献数
1

本報告では, ささやき声の音響特性と音声認識手法について述べる.データベースとして100名以上の話者が発生した6, 000文以上のささやき声, 通常発生, 顔画像を収録した.ささやき声と通常発声の比較では, 1)ケプストラム距離が有声音で4dB, 無声音で2dBであること, 2)ささやき声のスペクトルの傾きが通常発生に比べ緩やかであること, 3)1.5kHz以下のフォルマント周波数が通常発声に比べ高くなっていることが得られた.収録したささやき声から音響モデル(HMM)を学習し認識を行ったところ, 64%の単語正解精度が得られ, MLLRによる話者適応を用いた認識では, 単語正解精度が76%まで改善された.
著者
板倉 文忠 東倉 洋一
雑誌
情報処理
巻号頁・発行日
vol.19, no.7, 1978-07-15
著者
板倉 文忠
出版者
名古屋大学
巻号頁・発行日
1972

名古屋大学博士学位論文 学位の種類:工学博士(論文) 学位授与年月日:昭和47年11月4日
著者
池田 幹男 竹田 一哉 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.96, no.238, pp.23-30, 1996-09-12
被引用文献数
3

本研究では直交フィルタを導入し, 多チャネル化した櫛形フィルタによる雑音抑圧法を提案する. 雑音は直交フィルタのいくつものチャネルにまたがって均等に分布するのに対して, 音声は特定の成分に集中するので, 各チャネルの出力に雑音の振幅の推定値を用いて重みをつけて再構成することによって, 雑音抑圧が可能となる. 本方法は定常白色雑音か加わった音声に対しては信号対雑音比か最大6.5dB改善され, より一般的な駅構内の雑音が加わった音声に関しては, 最大5.0dB改善された.
著者
河口 信夫 松原 茂樹 若松 佳広 梶田 将司 武田 一哉 板倉 文忠 稲垣 康善
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.523, pp.61-66, 2000-12-15
被引用文献数
2

本稿では、名古屋大学音響情報研究拠点(CIAIR)で構築中の実走行車内音声対話コーパスの設計と特徴について述べる。道案内や店情報検索をタスクとする162対話を対象とした特徴分析の結果、(1)ドライバーの発話速度は通常の対話音声に比べて遅く、5〜7(mora/sec)である、(2)ドライバーの発話におけるフィラーの出現頻度は、1発話単位あたしり0.33個、1秒あたり0.174個であり、通常の人間対人間の自由対話に比べて少ない、(3)車両の走行中と停止中とでは、発話速度や話し言葉に特有な現象の出現に関して差がない、(4)停止中に比べ走行中の発話には、感動詞、及び、文発声途中でのポーズの出現頻度が高い、ことなどが明らかになった。
著者
西野 隆典 梶田 将司 武田 一哉 板倉 文忠
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.2, pp.91-99, 1999-02-01
被引用文献数
47

ヘッドホン受聴では, 頭部伝達関数(Head Related Transfer Function ; HRTF)を用いることにより, 立体音場を忠実に再生することができる。しかし, HRTFは方向に依存した関数であるため, HRTFを用いた聴覚バーチャルリアリティシステムでは, 測定した音源方向については忠実な立体音場が再生できるが, その他の音源方向については, 再生に必要なHRTFを新たに測定するか, すでに測定されたHRTFから推定して求める必要がある。しかし, HRTFの補間が可能であれば, 少数の測定HRTFから全方位のHRTFが作れるため, データ削減の有効な手段となるだけでなく, 滑らかな移動感を得ることができる。本論文では, (1)線形2点補間, (2)主成分分析を用いた補間の2手法を用いて, 水平面上のHRTFのインパルス応答と周波数振幅応答の補間可能性を, 客観基準と主観基準(移動感並びに方向定位感)により評価した。その結果, (1)水平面上のHRTFは45゜もしくはそれ以下の角度間隔で測定を行い, 未知のHRTFはそれらから補間可能であること, (2)線形2点補間は主成分分析による補間手法と比べて, より良い補間が可能なこと, (3)補間対象のインパルス応答と周波数振幅応答の間では, 補間精度の有意な差はなく, 位相は最小位相であっても良いことが明らかになった。
著者
西村 竜一 梶田 将司 武田 一哉 板倉 文忠 鹿野 清宏
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827837)
巻号頁・発行日
vol.42, no.3, pp.605-613, 2001-03

本論文では, Webベースのオンライン教育環境に音声入力機能を加えるWebSPEAC(Web SPEech Acquisition for Courseware)Systemを提案する.これまで, Webベースオンライン教育環境では, 音声を出力する教材の作成は可能だったが, 音声入力のできる教材やコミュニケーションツールの提供はできなかった.本システムは, (1)Webブラウザには音声入力機能のみを提供し, 音声を用いるアプリケーションプログラムはWebサーバ上で一括管理するので保守性が高い, (2)クライアント側は, 簡単な初期設定のみで利用できる, (3)サーバプッシュを利用してWebでの音声入力インタフェースを実現している, という特徴があり, 音声を用いたインタラクティブなWebベースのオンライン教材の作成を可能にする.また, 本システムの応用例として, Webベースの入力音声分析ソフトウェア, 音声確認システム, 受験者認証システムを作成した.このうち, 音声入力部分について, 入力音声分析ソフトウェアを利用してファイルアップロードによる従来システムとの比較実験を行った.その結果, 本システムはステップ数, 誤りステップ数, タスク完了時間において操作コストを削減できることが確認できた.
著者
梶田 将司 小林 大祐 武田 一哉 板倉 文忠
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.53, no.5, pp.337-345, 1997-05-01
被引用文献数
31

人間が音声として知覚する音がその他の音とどのように異なるのかを探求するため, 本研究では, ヒューマンスピーチライク(HSL)雑音を導入し, HSL雑音に含まれる音声的特徴を分析する。HSL雑音は, 複数の音声を加算的に重畳して作られるバブル雑音の一種で, その重畳回数に応じて音声的な信号から音声の長時間スペクトルを反映した定常雑音へと聴感は変化する。まず, この聴感上の変化を主観評価実験により定量化する。そして, HSL雑音に含まれる音声的特徴を振幅分布のガウス性, スペクトル微細構造の時間的変動性, スペクトル包絡の時間的変動性の三つの観点で分析した。その結果, HSL雑音の差分信号のガウス性及び, HSL雑音のスペクトル包絡の時間的変動が音声的特徴に大きく寄与していることが分かった。
著者
白勢 彩子 原 直 藤村 浩司 伊藤克亘 武田 一哉 板倉 文忠
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.124, pp.253-258, 2003-12-19

本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ,会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.This study aims to describe user problems and process of learning skill in using spoken dialogue systems and to reveal how these impact on the evaluation of the system usefulness. For this aim, we designed a new dialogue system and carried out a field test for a large number of subjects and asked them to evaluate the usefulness of the system. The results showed that the evaluation of the system did not correlate a recognition rate but user satisfaction and comprehension. This suggested that the spoken dialogue systems should be evaluated in terms of user factors. Controlled experiments are needed to discuss in detail.