著者
鳴海 拓志 佐藤 宗彦 谷川 智洋 廣瀬 通孝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.375, pp.311-316, 2010-01-14

味覚は,化学的信号の組み合わせからだけではなく,温度や食感,視覚,嗅覚,記憶といったようなさまざまな要素の組み合わせから認識される.このような複雑さをもつゆえに,これまで味覚情報を提示するディスプレイに関してはあまり研究がなされてこなかった.一方でこのような味覚の特性を利用し,正確な化学信号の組み合わせを実現するのではなく,化学的信号とその他の刺激を同時に提示することで味覚を提示するアプローチを取ることも考えられる.本研究では,視覚と味覚のクロスモダリティを利用した味覚ディスプレイとして,LED光源を用いて飲料の色を変化させることで,飲料を飲む人が感じる味を変化させる手法について検討をおこなった.本発表では,そのような味覚ディスプレイの評価実験と,インタラクションを取り入れることによる応用の可能性について報告する.
著者
中村 静 加藤 宏明 匂坂 芳典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.99, pp.45-50, 2009-06-17

我々は、日本人学習者の英語音声におけるリズム制御に対する客観評価法について研究してきた。この研究の経過で、日本語を母語とする学習者の潜在的なモーラ・タイミングの習慣が,英語のストレス・タイミングの生成に悪い影響を及ぼしているらしいことに注目した。そこで、本研究ではこの影響を調べるために、主にリズム制御に関与する音節の強弱の対比の観点から、母語話者音声に対する学習者音声の対応する種々の音声区分(強勢/弱勢音節,強/弱母音,内容語内/機能語内音節)の持続時間の差異について検討した。その結果,このような持続時間の差異が,英語教師である評価者による主観評価値を大きく左右していることを、両者の相関分析により確認した。
著者
岡田 美智男 鈴木 紀子 石井 和夫 犬童 早苗
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.338, pp.37-43, 1997-10-23
被引用文献数
2

日常での雑談などにおける発話には, (1)「意味を伝える」機能と, (2) お互いの発話に対して「意味を与えあう」機能とがいつも同居している. あるいは, 「伝えようとして伝わること」と相手の応答との重なりの中で「事後的に意味や役割が出現すること」とが同居している. これまでの行為遂行的な, 情報伝達的な側面を重視した対話研究では, 「伝えようとして伝わること」について主に検討されており, 後者の側面に対しては十分に議論が尽くされていない. 本稿では, 様々な発話の重なりの中で新たな意味を発現させうる「多声性を帯びた発話」の存在に着目し, その多声性に富んだコミュニケーション, すなわち「雑談」の成り立ちについて考察する. また, この多声的な関わりや間身体的な場の形成に着目しながら, 共同想起対話におけるユニゾン的な同時発話の現象の意味について考える.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.114, no.52, pp.279-284, 2014-05-17

本研究では通常歌唱をグロウル系統の歌唱音声の印象をもつ音声に変換するシステムの検討を行っている.先行研究では簡単な信号処理で歌唱音声にグロウルらしさを付与する方法が提案された.本報告では提案手法で用いる特徴付与のパラメタを対話的に操作し,歌唱音声にグロウルらしさを付与するGUIについて紹介する.提案手法は時間変調による基本周波数の高速な時間振動の付与,FIRフィルタによる処理範囲に共通した帯域強調処理,及び近似時変フィルタによる第3フォルマント周辺の高速な時間変調の付与の3つより構成されている.提案手法は変換処理に分析・合成を必要としないためリアルタイム処理を可能とし,ライブで一種のエフェクターとして用いることが出来る.GUIの開発は主にデモやポスターセッションの場で本手法による処理内容と処理の影響について直感的理解を促すことを目的としている.開発したGUIは実際にポスターセッションの場で操作し,操作性やデザイン性についてコメントを頂きたい.
著者
齋藤 大輔 松浦 良 朝川 智 峯松 信明 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.406, pp.189-194, 2007-12-13
被引用文献数
6

本報では,ケプストラムベクトルの方向成分が声道長の変化に対して強く依存していることを理論的,実験的に示す.さらにこの依存性がn次元のケプストラム空間における回転として表出されることを示す.音声認識の研究においては,年齢や性別の違いといった歪みを取り除くため,声道長正規化(VTLN)とよばれる技術が広く用いられている.VTLNはスペクトルドメインにおける周波数ウォーピングによって実現されるが,ケプストラムドメインでは線形変換c=Acとして表現する事ができる.しかしこの変換行列Aの幾何学的な性質に関しては今まで十分に議論されてこなかった.本研究ではn次元空間における幾何学を通して,これらの変換が全てのケプストラムベクトルをおよそ等しく回転させる事を示す.さらに分析再合成音を用いて,実際にケプスラムベクトルが回転している事を実験的に確認した.身長180cmの話者と身長120cmの話者を比較した場合,そのケプストラムベクトルがおよそ直交していることがわかった.本報の結果から従来の音声認識システムが子供の声のような特異音声を苦手とする一因を定量的に示す事ができた.
著者
加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.587, pp.15-22, 1998-03-06

聴取実験により, 促音, 撥音, 無声化母音, 長母音などいわゆる特殊拍を含むセグメントの時間長変動に伴う知覚的な歪みがどの程度許容されるかを調べた.特殊拍を特徴付ける2つの要因, つまり母音・子音などセグメントのタイプと, 拍数の違いなどによるセグメント持続長のバリエーションに着目し, 通常拍との比較を行なった.その結果, 前者の要因の効果が, 母音, 鼻音, 摩擦音と無音の順に許容される変動の範囲が広がるという傾向で, 後者は, 短い持続長より長い持続長の方が許容範囲が広いという傾向として現れた.さらに, セグメントタイプと持続長の要因の交互作用も見られた.母音タイプの方が摩擦音タイプよりも持続長の効果が大きかった.以上の結果に介在する知覚メカニズムを, 音韻固有のラウドネスや持続長の違いに基づく時間長弁別能の違いと, 拍数など音韻論上の構造の内的処理との関係において論じる.
著者
野村 祐基 磯村 太郎 板井 陽俊 安川 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.239, pp.73-77, 2007-09-21
被引用文献数
2

近年,歩行足音を用いた個人識別に関する研究が進められている.従来の研究では特徴量抽出を中心に議論されている場合が多い.著者らは歩行足音のスペクトルに対してDPマッチングを適用することで個人識別が可能であることを示した.しかし,観測波形に含まれる足音の開始位置を既知として足音部分の波形を切り出して処理している.本稿では足音の開始位置が未知とした場合のリアルタイム処理を考慮したDPマッチングによる識別方法を検討し,その結果を示す.
著者
駒木 亮 山田 玲子 ヨンオン チェ
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.165, pp.39-46, 1999-07-08
被引用文献数
1

第二言語音の知覚に及ぼす母語の影響を検討した. 韓国語話者と日本語話者の米語/r/,/l/音のききとり実験の結果を報告する. (1)/r/-/l/対立が含まれる音韻環境別のききとり難易度, (2)カテゴリー知覚, (3)/r/-/l/音知覚の手がかり, の各実験から,/r/、/l/音知覚における韓国語話者の優位性が示された. しかしどの側面においても同じように優位なわけではなく, 音韻環境別の難易度と母語との間に顕著な交互作用が見られた. そこで, 日韓両話者が米語/r/,/l/音をそれぞれの母語内でどのような音韻に対応づけているがという点に焦点をあて, 音韻環境別に知覚的同化の実験を行った. 第二言語音が同化する母語音および両者の適合度から外国語音対立知覚の困難度が予測可能であるという説明モデル, PAMに即して解釈することにより, 知覚的同化実験の結果が確かに音韻環境別のききとり難易度の実験結果と一致していることが確かめられた.
著者
キャンベル ニック プラック アラン
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.39, pp.45-52, 1996-05-16
被引用文献数
65

本報告では、話者性や発話様式の特徴を失わずに任意の音声を合成するための方法として、予め録音された音声データベース中の音素単位の音声波形を、何らの信号処理も行なわずに接続し、連続音声として出力する方法について述べる。本方式は特徴抽出過程、最適重み決定過程、単位選択過程および波形読み出し過程からなり、言語および話者に依存しない。本方式では音声波形自身は生成せず、所望の合成音声の性質に最も近い音素単位の音声波形を、与えられた音声データベース中から取り出すためのインデックスを作成し、音声出力時にはインデックスに従って音声データベースに直接アクセスし、音声波形を取り出す。最適な音素波形の系列を得るために、前処理として、与えられた音声データについて音素記号と音響的および韻律的な特徴の一覧表を作ると共に、それぞれの特徴に対する最適の重み係数を求めておく必要がある。
著者
清水 奨太 大谷 真 平原 達也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.165, pp.85-90, 2007-07-19

非可聴つぶやき声(Non-Audible Murmur : NAM)の音響的特徴とソフトシリコーン型NAMマイクロフォンの特性を明らかにした。NAMは「微弱な呼気による乱流雑音の声道共鳴音の肉導音」であり,特別に設計されたNAMマイクロフォンを体表に装着させることで検出できる。NAMマイクロフォンはほぼ個体差が無く, NAMマイクロフォンの周波数特性は約-17dB/oct.で高域減衰していた。NAMマイクロフォンの感度は-36dB(1V/1 Pa=0dB@1kHz)であった。NAMマイクロフォンを用いて収録された男性話者26名・女性話者17名(約630分)のNAM信号の音響分析を行なった。このNAM信号のSNRは約16dBであり,帯域は約3kHzであった。NAM信号の長時間スペクトルは500〜800Hzにピークがあり,約-17dB/oct.で高域減衰していた。このNAM信号の長時間スペクトルからNAMマイクロフォン特性を補正して求めたNAM本来の長時間スペクトルは、200Hz〜300Hzにピークがあり、約-23dB/oct.で高域減衰していた。この結果は、声帯共鳴音が生体軟組織を伝搬する際の減衰特性の数値シミュレーションの結果とほぼ一致する。
著者
佐藤 奨 坂野 秀樹 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.97, pp.41-46, 2011-06-16

本研究は,楽曲推薦の特徴量に利用出来るような音響特徴量,特にラウドロック系の楽曲を特徴付ける音響特徴量の提案をする.ラウドロック系の楽曲は,歪んだ音を出すエレキギター及びベース,激しく叩くドラムの音が特徴的であり,上記の楽曲と,それ以外の楽曲とを混在させた曲順で聴くことはほとんどない.よって,両者を分類できる特徴量は,有用な特徴量となることが期待できる.本稿では,提案した音響特徴量を用いて,ラウドロック系,J-pop,ニューエイジ系の自動ジャンル分類実験により客観評価を行った.最も良い条件の場合,ラウドロック系の楽曲とそれ以外の楽曲とを区別する2ジャンルの識別率が97%,3ジャンルの識別率が87%となった.さらに,この音響特徴量が楽曲の印象とどのような対応があるのか,印象尺度を用いた主観評価実験を行った.その結果,音響特徴量と「激しい」「騒々しい」「優しい」といった印象との間に,強い相関があることが確認され,提案する音響特徴量が,主観的尺度と対応することが明らかになった.
著者
比屋根 一雄 澤部 直太 飯尾 淳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.586, pp.65-72, 1998-03-05
被引用文献数
17

短時間に減衰する単発音について、その擬音語表現を6種類に分類し、それらの実際の音信号のスペクトル構造の特徴について調べた。ガンマトーンを用いた疑似単発音について擬音語への認知実験を行い、中心周波数、残響時間、周波数ゆらぎに対するパラメータ依存性を定量的に解析した。カン、チンなどの衝突減衰音では母音が中心周波数を表し、1kHz以下は/o/、1〜2kHzは/a/、2kHz以上は/i/を用いる。残響時間は語尾変化として表われ、4kHzでは0〜100msがチッ、100〜200msがチン、300ms以上がチーンと表現される。純粋なガンマトーンに周波数揺らぎを加えてゆくと、カンやタンから、パン、バン等の破裂音として認識されるようになる。
著者
西村 竜一 内田 賢志 李 晃伸 猿渡 洋 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.522, pp.93-98, 2001-12-13
被引用文献数
5

ASKA(アスカ)は, 大学の受付案内システムを目標として開発中の頭部や腕のジェスチャ機能を持つ人間型音声対話ロボットである.音声対話機能は, 大語彙連続音声認識エンジンJuliusと学内案内タスク向けN-gram言語モデルを基礎としたキーワード検索による音声認識理解部と音声合成部によって構成されており, 対人センサやジェスチャ生成などの他のモジュールと状態を通信しながら分散的な動作を行なう.本ロボットは, 奈良先端大における学内共同プロジェクトで開発されており, エージェントシステムにおける様々な要素技術の実環境での検証プラットフォームと位置付けられている.今後も新たな要素技術を採り入れながら開発を続ける予定である.本稿では, 音声対話機能の実装方法を中心に現在のASKAの概要および今後の予定について述べる.
著者
福井 孝太郎 石川 優馬 大野 圭介 榊原 菜々 高西 淳夫 誉田 雅彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.265, pp.19-24, 2008-10-16
参考文献数
6

人間の発声器官の3次元機械モデルの確立を目的としたWaseda Talkerシリーズの開発において,音声生成の明瞭性の向上を目的とした新型発話ロボットWT-7R(Waseda Talker No.7 Refined)を開発した.これまでの3次元発話ロボットWT-7においては,舌部をリンク機構で構築し,その上に熱可塑性エラストマー・セプトン製のカバーをかぶせることで声道としていた.しかし,この方法ではカバーが十分な厚みが無いため音漏れが生じ,共鳴特性に問題があるため,結果として,生成される母音が不明瞭になってしまっていた.この問題を解決するために,新型ロボットでは,リンクが駆動する舌内部の空間を液体で満たすことにより,共鳴特性の向上を目指すこととした.実験による検討の結果,セプトンへのダメージが少ないという利点から,封入液体にはエチレングリコールを選定し,可動部ではオイルシールや液体ガスケットによって液漏れを防いでいる.また,WT-7においては舌のリンク自体の可動域が不足していたため改良を行い,口唇部においては断面積変化が不十分であったため,確実に必要な断面積変化を実現できる機構を採用した.これらの改良により,発話ロボットによって生成される母音の明瞭性が向上し,スペクトル解析で計測したフォルマントのバンド幅が狭くなっていることが確認できた.
著者
森 浩一 外山 崇子 三井 真紀 今泉 敏 志村 洋子 中島 八十一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.639, pp.77-84, 1999-03-05
被引用文献数
5

機能的核磁気共鳴画像法 (fMRI) は低侵襲なため、脳機能の局在の研究によく使われる。しがしながら大騒音 (93〜105dB SPL) を伴うので、音による反応を調べるには不向きとされている。MRI 装置内では磁性体が使えないため、音は非磁性のチューブ経由で聞くようになっているが、付属するイヤホンは 10dB 程度の防音効果しかない。そこで、イヤホンを挿耳型にして防音を改善し、連続ではなく間歇撮像で記録することによりほとんど騒音のない状態で音を聴取できるようにした。その結果、第一次聴覚野のある横側頭回 (Heschlgyrus) と聴覚連合野のある側頭平面の信号が、撮像騒音で飽和することなく検出可能であった。
著者
森山 剛 斎藤 英雄 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.95, no.319, pp.9-16, 1995-10-20
被引用文献数
6

本研究では、人が声を聞いた時に知覚する感情の概念と、平静時から変化した音響パラメータとを定量的に対応付ける分析合成系を提案する。まずいくつかの言葉で感情音声を発し、それを聞いた際に受ける印象を主観評価した結果を因子分析して因子を得る。この時同時に感情音声の音響パラメータを主成分分析してその主成分を得る。こうして得られた因子と主成分の重回帰分析を行うことにより得られる重回帰係数行列を対応情報とする。分析系では、対応情報に基づいて得られた音響パラメータから感情情報を獲得する。合成系では、対応情報に基づいて、感情情報から音響パラメータの平静時からの変化分を得る。本稿では、構築するシステムの概要を述べると共に抽出された因子の妥当性を検証する。
著者
戸田 智基 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.253, pp.1-6, 2005-08-19

HMMに基づく音声合成方式では, あらかじめ音声パラメータ系列をモデル化するHMMを学習しておき, 合成時には入力テキストに対応するHMMから尤度最大化基準により音声パラメータを生成する.静的・動的特徴量間の明示的な制約条件を導入することで, 適切な遷移を満たすパラメータ系列の生成が可能となり, 不連続感の少ない滑らかで安定した合成音声が得られる.一方で, 音声信号がもつ詳細な特徴は統計処理により失われるため, 生成されるパラメータは過剰に平滑化されたものとなり, 合成音声の肉声感は大きく損なわれる.本稿では, 音響モデリングで失われる特徴量の一つとして, パラメータ系列全体における変動量に着目し, 従来考慮されている静的・動的特徴量に対する尤度のみでなく, 系列内変動に対する尤度も考慮した音声パラメータ生成アルゴリズムを提案する.新たに導入される尤度は, 従来法において顕著にみられる生成パラメータの系列内変動の減少を抑える働きをする.実験的評価結果から, 提案法により合成音声の自然性は大幅に改善されることを示す.
著者
尾久土 正己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.375, pp.207-211, 2010-01-14

皆既日食は古代の人々にとってはまさに天変地異であった.しかし,従来のTVやインターネットで放映されている日食の映像は太陽にフォーカスされており,その劇的な変化の一部しか表現出来ていない.そこで、我々は4Kの超高精細映像システムを使ってドームスクリーン上に日食を再現することに挑戦した.本報告では,我々のシステムとそれを使った実験の教育効果について紹介する.
著者
得丸 公明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.110, no.357, pp.61-66, 2010-12-13
被引用文献数
1

筆者は2007年に,今から13万年前から6万年前の居住が確認されている世界最古の現生人類遺跡,南アフリカ東ケープ州のインド洋沿いにあるクラシーズ河口洞窟を訪問し,言語の起源とメカニズムについて興味をもち考察を始めた.洞窟内部はきわめて安全でありヒトの晩成化と脳拡大を促したと考えられるほか,静かで暗いため居住者は音に敏感になる.また,洞窟は音響シェルターであるため,敵に存在を知られることなくいくらでも音を出すことができる.言語と現生人類は洞窟の中で生まれたのではないかと考えたのだ.言語のさまざまな過程についての知識を得るために,言語学,音響工学,通信工学,心理学,人類学・霊長類学,神経生理学,論理学,分子生物学,情報理論などの学際的著作を読んだ筆者は,ヒトとヒト以外の動物の唯一の根本的な違いは,音声通信のデジタル化,すなわち言語にあるという仮説を得た.しかし「デジタル」の適当な定義が見つからない.筆者はシャノンやウィーナーやフォン・ノイマンらの書いた情報理論の古典を読むことで,客観的で必要十分な「デジタル」の定義を確立しようと試みた.すると「デジタル」概念は思っていたよりも広く深く,「情報ネットワーク」や「自己増殖オートマトン」を可能にする原理であることがわかった.今回の発表は筆者が2010年を通じて情報処理学会,電子情報通信学会,人工知能学会の関連する研究会で20回以上にわたって行なった発表のまとめである.
著者
柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.540, pp.21-26, 1997-02-21
被引用文献数
3

同時に複数の認識対象が混在する音の認識では,音源同定処理が必要である.本稿では,音楽の生演奏など,実環境における音の多様性や変動にも対処できる音源分離同定を行うことを目的として,適応型テンプレートを用いた音源同定処理を提案する.さらに,この処理を応用して,同時に複数の音を認識対象とするシステムの代表例であるアンサンブル演奏の認識システムを構築する.構築したシステムに対し,自然楽器音の単音によるベンチマークテスト,およびアンサンブルの生演奏を用いた音楽認識テストを行った結果,単純なマッチトフィルタによる音源同定処理に比べ,提案手法が有効であることが確かめられた.