著者
大島 和臣 出口 利定 今泉 敏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.695, pp.31-36, 2005-02-24
参考文献数
5
被引用文献数
3

高機能の自閉症スペクトラム障害児20名と健常児28名を対象に、音声から話者の意図を理解する能力を検討した。音韻情報(辞書的意味)が肯定的な短文と否定的な短文を、肯定的・否定的どちらかの感情を持って成人女性が話した音声を、皮肉や冗談を表す音声として用いた。韻律課題では話者の感情を、表情-韻律課題では話者の感情と話者の表情を判断した。その結果、両課題において自閉症スペクトラム障害児は課題の正答数が健常児よりも有意に少なかった。また、課題に文脈情報を加えても同じ傾向を示した。この結果は、音韻情報と韻律情報を分離する能力と、韻律情報と表情を適正に統合し話者の発話意図を理解する能力が加齢に応じ発達するものの、健常児よりも低いことが示された。
著者
佐々木 隆仁 垣渕 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.120, pp.17-23, 1999-06-17
参考文献数
7

「Truster」は、リアルタイムで信頼度の高い心理分析結果を表示する意思決定支援システムです。専門家が行うような高度な感情分析を容易に行う独特なアルゴリズムをべースに強カな音声心理分析を特徴としています。この「Truster」の音声心理分析アルゴリズムと実証データを検証します。
著者
橘 誠 才野 慶二郎 久湊 裕司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.113, no.366, pp.123-128, 2013-12-12

HMM音声合成は統計的な韻律のモデル化により,話者性やスタイルを柔軟に多様化することができる.本稿では,その表現力を波形素片接続型の歌声合成システムであるVOCALOID^<TM>に取り入れる方法として,歌唱表現が現れる重要な特徴と考えられるピッチの変化をHMMでモデル化,生成する歌唱スタイル生成手法を提案する.HMM音声合成手法を歌唱スタイルのモデル化に利用する際には,未知の音高に対しても適切なパラメータ生成を行う必要がある.そこで本研究ではピッチベンドチェンジを用いたモデル化を提案する.また,長い時間伸ばされる音符に対して自然な変動を付与するため,ノート内を複数のセグメントに分割した単位でモデル化し,多段階のコンテキストクラスタリングを導入して楽曲構造と音符内の変動を階層的に表現する.また,この手法をVOCALOID^<TM>3の機能であるJob Pluginとして組み込んだ例を紹介する.
著者
鏑木 時彦 大毛 勝統
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.308, pp.13-18, 2009-11-19
参考文献数
18
被引用文献数
3

声門を通過する呼気の流量は、音声の実質的な音源となる。本研究では、発声時の呼気流量を精度良く推定するため、空気の粘性の影響を考慮した流体解析と、音源-声道フィルタ間の相互作用を考慮した発声モデルを検討する。空気の粘性の影響は、声帯表面の境界層という形で現れる。これは流速の急勾配であり、声門の実効的な流路の大きさや流れの剥離に影響を与える。音源-声道フィルタ相互作用は、音源波が声道を伝搬し声門付近に音圧勾配を作ることで、再び呼気流や声帯振動などの音源機構に影響を与えるものである。本論では、これらの機構を取り入れた音声生成モデルについて述べ計算結果を示す。
著者
寺内 美奈 時田 佳子 菊池 浩平 堀内 靖雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.386, pp.37-40, 2004-10-28
参考文献数
4
被引用文献数
3

手指動作と表情,口形などの非手指動作によって意思や感情を伝える手話は,聴覚障害者の1つのコミュニケーション手段である.手話は対話言語であることから,話者同士がどのように話を進めていぐかを解析することは,手話の言語構造を明確にするとともに,手話学習への指針ともなりうる.そこで,著者らは手話のターンテイキング(発話交替)に着目し,日本手話における会話構造と話者交替のモデル化を試みている.そこで,ネイティブスピーカによる日本手話対話例文データを収録し,工学院大学で開発した対話映像解析支援システムMATを用いて,話者交替時での手指信号ならびに非手指信号の詳細な解析を進めている.本報告では,対話データの収集方法,対話映像の分析方法,解析の途中経過として得られた対話の特徴などについて述べる.
著者
川上 隆 中井 満 下平 博 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.627, pp.25-32, 2000-02-18
参考文献数
14
被引用文献数
2

本稿では、隠れマルコフモデル(HMM)を用いて与えられた旋律に自動で和声付けを行なう手法を提案し、実験的検討結果を報告する。旋律は背後に隠れた和声進行から生成される、とする旋律生成の隠れマルコフモデルを提唱し、その逆問題として、与えられた旋律から背後の和声進行を最尤推定する。2種類の和声進行のモデル、いくつかの旋律生成のモデル、さらにN-bestアルゴリズムによる和声付け複数候補抽出や、与えられた旋律の調性推定及び転調検出についても論じる。童謡や歌曲及びバッハのコラールから学習した和声進行確率モデルを用いた、実際に和声付け実験を行なった結果についても述べる。
著者
松島 俊明 坪井 邦明 志村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.636, pp.7-14, 2001-02-16

筆者らは尺八譜の情報処理システムの研究の一環として尺八譜のための標準データ形式COMSOを提案し, これに基づいたシステムの開発を進めてきた.COMSOコードは, 基本音階における各音は流派によらず同じ奏法によるものと仮定し, 原則として音高, 指遣いのみに基づいて機械的に決定できる譜字コード体系である.しかし, 各流派の教授資料を詳細に比較した結果, 指遣いも含めた演奏方法に相違があり, すべての音階音を各流派間で一意に対応付けることができないことが判明した.この問題を解決するためにCOMSOコードの全面的な改定を行い, 併せて新しい音価表記法の提案および尺八譜処理システムのユーザインタフェースの見直しを行い, 尺八譜の作成・出版業務の支援を可能とするシステムとして再構築を開始したので報告する.
著者
三関 公生 赤嶺 政巳 押切 正浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.93, no.156, pp.1-8, 1993-07-23
被引用文献数
1

本報告は、駆動信号の適応密度パルス列モデルに基づくCELP方式を低レート化に向け改良した3.75kb, SADP-CELP(Adaptive Density Pulse-Code Excited Linear Prediction)音声符号化方式について述べる。方式改良のために、(1)PARCOR-LSP領域でのLPC係数情報のベクトル量子化(2)最適ビット配分に基づくADPパタン決めの(3)整数/非整数の2段階ピッチ周期サーチ(4)ADPの高速直交化サーチ(5)ピッチ情報のサンプル補間を用いたポストフィルタ、を導入した。提案方式は3.75kb/sで6.7kb/sのVSELP方式に近い品質の音声を提供できる。
著者
尾崎 晃 マルタ ルーカス 西脇 由博 宮島 千代美 北岡 教英 武田 一哉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.312, pp.33-38, 2008-11-13
被引用文献数
4

自動車の運転とそれに付随する音声対話を観測した,マルチメディア信号コーパスを構築している.広い範囲の人間の『行動』を,様々な視点から説明できるモデルの研究を推進することを究極の目的として,音声・映像により記録される自動車内外の状況に加え,動作,生理,心理といった運転者の状況,速度や車間距離といった自動車の状況を様々なセンサーにより計測している.さらに,米国,トルコ等との国際協調により,海外の2拠点ともほぼ同じ方法でデータ収集を行った.本稿では,コーパス構築の状況と収集されたデータについて概説するとともに,収集したマルチメディア信号を用いた研究の概要について報告する.
著者
関本 英彦 戸田 智基 猿渡 洋 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.106, no.221, pp.37-42, 2006-08-23
被引用文献数
4

携帯電話が普及するにつれて,「いつでも」「どこでも」コミュニケーションができるようになった.携帯電話を使うことがとても便利である反面,外部雑音の影響により,正しい内容を受聴できない問題がある.例えば,人ごみの中といった騒音による影響のため,小声でプライベートな会話ができない.本稿では,外部雑音に頑健な非可聴つぶやき(Non-Audible Murmur: NAM)マイクを用いた小声(Small Body Transmitted Ordinary Speech: SBTOS)によるコミュニケーションを考える.NAMマイクで収録された音声(肉伝導音声)は外部雑音に頑健である反面,こもった音声になり,聞き取りが困難である.そのため,混合正規分布モデル(Gaussian Mixture Model: GMM)を用いた声質変換技術により音質改善を行う.その際に,SBTOSから通常音声へと変換(SBTOS-to-SP),また小声へと変換(SBTOS-to-SSP)を検討する.入出力間における有声無声の一致率を調べたところ,SBTOS-to-SSPはSBTOS-to-SPよりも一致していることがわかった.客観,及び主観評価実験の結果,SBTOS-to-SSPはSBTOS-to-SPより優れていることがわかった.
著者
阿部 雅嗣 三輪 譲二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.630, pp.7-12, 2005-01-20
被引用文献数
1

本論文では, ユビキタス社会における先進的マルチメディア処理を用いた統合型キャンパスシステムを構築するため, URLエンコードした任意の日本語テキストから規則音声合成を行うWeb対応型の音声合成サーバ・クライアントシステムを提案する.本システムは, サーバからクライアントへ, 合成音声波形の転送が必要という欠点があるが, 音声合成ソフトウェアを利用者がインストール不要のため, 利用者に扱いやすく, また, 携帯を含めたマルチプラットホームのクライアントで利用可能という長所を持つ.また, 本論文では, Web型電子メールや日本語Webページの音声読み上げ, 日本語漢字試験のヒント音声や日本語聴解試験の問題音声のe-Learning等への応用例について述べる.
著者
ディ・ペルシア レアンドロ 大田 健紘 柳田 益造
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.686, pp.53-58, 2006-03-21
被引用文献数
9

本稿では,周波数領域独立成分分析に基づく手法によりブラインド音源分離を行った際に問題となる周波数ビン間で信号の並び順を揃えるパーミュテーション問題の解決法を提案している.これまでに,パーミュテーション問題の解決法としては,各周波数の指向特性を基に解決する方法や,分離信号の周波数間での相関に基づいた方法,さらには音声信号の調波性に基づいた方法などが提案されているが,完全な解決には至っていない.そこで,筆者らはパーミュテーション問題を回避する手法を提案している.従来の周波数領域ICAは,各周波数ビンを時間-周波数の行列として扱い分離処理を行っていたため,パーミュテーション問題と対峙する必要があった.しかし,提案法では,各周波数ビンを連結し1つのベクトルとして扱い分離処理を行っている.これにより,全周波数ビンが同時に入れ替わる可能性はあるが,各周波数ビンが他のチャネルに入れ替わることはない.
著者
平山 直樹 森 信介 奥乃 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.112, no.369, pp.7-12, 2012-12-13

本稿では,日本語方言音声認識のための言語モデルの統計的構築法を開発する.方言言語モデル構築においては,その方言の言語コーパスの不足が大きな課題である.その解決のため,大規模共通語言語コーパスの単語単位での方言への変換を行う.共通語・方言間の対訳コーパスを用いて統計的に変換ルールを学習し,重み付き有限状態トランスデューサ(WFST)で変換器を実装する.このWFSTに共通語文章を入力することで,対応する方言文章が自動的に出力される.本手法で構築した方言言語モデルを用いて方言音声認識を行うことで,共通語言語コーパスで学習した言語モデルより高い認識精度が得られた.
著者
益子 貴史 小林 隆夫 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.64, pp.33-38, 1997-05-22
被引用文献数
8 2

隠れマルコフモデル(HMM)に基づいて,任意のテキストからそれに対応する滑らかな唇形状の動きを生成する新たな手法を提案している. 提案手法では,音素や音節等,各音声単位に対応する唇形状の動きをHMMによりモデル化している. 画像生成時には,与えられたテキストに対応する文HMMを音声単位HMMを接続することにより構成し,得られた文HMMから尤度最大化基準により,唇形状の動き表す最適なパラメータ系列を求めている. 本手法の特徴は,既に提案したHMMに基づく音声合成法と同一の枠組で画像の生成が可能な点にあり,音声と画像で同一の音声単位を用いて統一的にモデル化を行なえば,音声・画像の同時生成が容易に実現できる. 本論文では,唇動画像生成システムの構成を示すとともに,実際に小規模な実験的システムを構築し,得られた画像が自然発声に近い滑らかな唇の動きを表現可能なことを示す.
著者
中村 友昭 長井 隆行 岩橋 直人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.375, pp.7-12, 2010-01-14

本稿では,ロボットが身体性を利用することで取得する視覚・聴覚・触覚のマルチモーダル情報を用い,総合的に物体のカテゴリ分類を行うことで,物体概念を形成する手法を提案する.ロボットは,複数の情報を利用することにより,今まで画像だけでは分類することができなかった物体であっても分類することができるようになり,より人間の感覚に近い物体概念を形成することが可能である.提案するアルゴリズムはグラフィカルモデルに基づいており,物体のカテゴリゼーションはそのパラメータである条件付確率を推定する学習の問題となる.提案手法は教師なし学習であるため,人間が正解を教えることなくロボットの自律的なカテゴリゼーションが可能である。また,学習結果を利用した未知物体のカテゴリ認識や,カテゴリを通した機能の確率的推定も可能となる.さらに本稿では,マルチモーダルLDAにより形成された概念を基に,単語の意味を接地する手法を提案する.提案手法では,入力されたマルチモーダル情報に対応する単語を確率的に推論することや,単語からその単語が指す概念を推定すること,さらに単語とモダリティとの結びつきを求めることが可能となる.本論文では,提案するアルゴリズムを実際のロボットに実装することで,提案手法の有効性を示す.
著者
北条 伸克 亀岡 弘和 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.113, no.308, pp.13-18, 2013-11-14

本稿は,高品質なテキスト音声合成を目指し,複合ウェーブレットモデル(composite wavelet model; CMW)と隠れマルコフモデル(hidden Markov model; HMM)の統合モデルに,フォルマント周波数軌跡のモデルを組み込む.ケプストラム特徴量による従来のHMM音声合成方式では,モデル学習時におけるケプストラム特徴量の平均化がスペクトルの周波数方向の平滑化の原因となり,一般にbuzzyな合成音声へ劣化する原因となった.これに対し,フォルマント周波数に相当する特徴量の平均化はスペクトルの平滑化をもたらさないと期待される.このような観点から,我々は,CWMとHMMの統合モデルによる音声合成方式を過去に提案した.一方で,従来のCWMとHMMの統合モデルは,スペクトル系列の区分定常な生成モデルであり,ダイナミクスのモデル化に課題があった.本稿は,CWMがフォルマント周波数に相当するパラメータを持つことに着目し,フォルマント周波数軌跡の生成モデルをCWMとHMMの統合モデルに組み込み,スペクトル系列のダイナミクスをモデル化する.本稿では,実験を通して提案モデルがフォルマント周波数軌跡を十分に推定することを定性的に確認した.
著者
安田 麗 林 良子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.451, pp.13-17, 2010-02-25

日本語音声の特徴的現象である母音の無声化は,聞き手が誰であるかという会話の状況によって,その出現が変化する要素の一つであると考えられている.本研究では,そもそも母音の無声化が少ないとされている近畿方言話者が、東京方言話者と話す場合,近畿方言話者と話す場合,そして外国人と話す場合にどのような発音がなされているのかについて,母音の無声化に焦点を当て実験を行った.その結果,近畿方言話者の会話における母音無声化の出現については,個人差があるものの、平均すると対東京方言話者,対外国人留学生,対近畿方言話者の順で,母音無声化率が高い傾向があることがわかった.この結果より,近畿方言話者は対話相手が誰であるかによって母音無声化を制御し,話し方を変化させていることが示唆された.
著者
徳山 鎮 田口 友康
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.539, pp.1-6, 1997-02-20

楽器の基準ピッチを上げることで音色が「明るくなる」、「張りが出る」などと言われている。1台のピアノについて、基準ピッチをA_4=436,442,445Hzにしたときの物理的変化を調べ、聴取実験を行った。単弦では、基準ピッチが高くなるほどエネルギーの減衰が速くなリ、インハーモニシティは小さくなる傾向があった。しかし、聴取実験では上記の物理変化が聴感上に影響を与える点については肯定的な結果が得られなかった。
著者
河口 信夫 松原 茂樹 若松 佳広 梶田 将司 武田 一哉 板倉 文忠 稲垣 康善
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.523, pp.61-66, 2000-12-15
被引用文献数
2

本稿では、名古屋大学音響情報研究拠点(CIAIR)で構築中の実走行車内音声対話コーパスの設計と特徴について述べる。道案内や店情報検索をタスクとする162対話を対象とした特徴分析の結果、(1)ドライバーの発話速度は通常の対話音声に比べて遅く、5〜7(mora/sec)である、(2)ドライバーの発話におけるフィラーの出現頻度は、1発話単位あたしり0.33個、1秒あたり0.174個であり、通常の人間対人間の自由対話に比べて少ない、(3)車両の走行中と停止中とでは、発話速度や話し言葉に特有な現象の出現に関して差がない、(4)停止中に比べ走行中の発話には、感動詞、及び、文発声途中でのポーズの出現頻度が高い、ことなどが明らかになった。
著者
松村 雅史 辻 竜之介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.370, pp.7-12, 2005-10-20
被引用文献数
1

笑いは, ストレス低減など生理学的あるいは健康的な効果があるとの報告がある.本研究では, 笑いと健康増進および介護予防に関わる生理学的要因の関係を明らかにするために, 笑い声の無拘束・長時間モニタリングするシステムの開発を研究目的としている.本研究では, まず, 日常会話の中で笑い声をハンズフリーかつワイヤレスで無拘束・長時間モニタリングするシステム(爆笑計)を開発した.本システムは, 頸部表面に装着した喉頭マイクロホンにより声帯振動を検出し, 会話音声中の中の笑い声は, 繰り返し発声が行われることを特徴量として識別できることを示す.