著者
中村 哲 花沢 利行 鹿野 清宏
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.12, pp.942-949, 1989-12-01
被引用文献数
4

本論文では、筆者らがすでに提案した話者適応化アルゴリズムをHMM音韻認識に適用する。HMMに適用する際には、動的特徴を考慮したセパレートベクトル量子化、ファジィベクトル量子化、ファジィヒストグラム、ファジィマッピングを用いる。更に、HMMとの効率的な整合のために、対応づけヒストグラムを標準話者のファジィ級関数としてファジィHMMを計算する話者適応アルゴリズムを用いる。音韻バランス216単語、重要語5,240単語を用いて有声破裂音/b,d,g/及び全音韻の音韻認識実験を男女計3名の話者について行った結果、次の事柄が確かめられた。(1)動的特徴を考慮したセパレートベクトル量子化を用いることにより有声破裂音の認識率が6.4%改善できる、(2)ファジィベクトル量子化を用いることにより有声破裂音の認識率が3.4%改善できる、(3)ファジィヒストグラムを用いることにより話者適応化の学習に必要な単語数を100単語から25単語に削減しても認識率の低下を0.4%に抑えられる。また、有声破裂音の認識率は、男性間で83.1%、男女間で76.5%で、従来法[M.Feng et al. ICASSP 88]との比較では11.7%の認識率の改善となること、全音韻の認識では、男性間で75.6%、男女間で71.8%で、上位3位までの累積認識率では、男性間、男女間いずれの場合にも約91%を達成できることが分かった。
著者
佐藤 拓哉 名越 誠 森 誠一 渡辺 勝敏 鹿野 雄一
出版者
日本生態学会
雑誌
保全生態学研究 (ISSN:13424327)
巻号頁・発行日
vol.11, no.1, pp.13-20, 2006-06-25
被引用文献数
2

世界最南限のイワナ個体群キリクチSalvelinus leucomaenis japonicusの主要生息地において、過去13年間にわたって、キリクチおよびそれと同所的に生息するアマゴOncorhynchus masou ishikawaeの個体数変動を調べた。また、調査水城におけるキリクチ個体群の現在の分布構造を把握するために、流域に11カ所の調査区間を設定して、それぞれの場所での生息密度と体長組成を調べた。調査水城に設定した約500m区間におけるキリクチとアマゴの推定生息個体数はともに減少傾向にあり、特に2000年以降、キリクチの個体数は低い水準で推移していた。2004年時点では、アマゴの推定生息個体数は、キリクチの約2倍であった。2004年に生息範囲のほぼ全域で行なった捕獲調査において、キリクチは本流の下流域ではほとんど捕獲されず、上流域と支流を中心に分布していた。一方、アマゴの生息個体数はすべての調査区間で大差はなかった。また、キリクチ当歳魚はほとんどが支流で捕獲されたが、アマゴ当歳魚は支流と本流で大差なく捕獲された。標準体長の季節変化を調べた結果、キリクチ当歳魚はアマゴ当歳魚に比べて浮出時期が1-2ヶ月遅いと推察され、その平均値は、すべての月においてアマゴ当歳魚よりも低かった。また、1歳以上のキリクチの平均体長は、すべての調査区間でアマゴよりも小さい傾向が認められた。これらの結果から、本調査水域におけるキリクチの生息個体数と生息範囲はともに減少傾向にあることが確認された。また、キリクチはアマゴとの種間関係において劣勢にある可能性が示唆された。このような現状のもとでの、キリクチ個体群の保護・管理策について考察した。
著者
熊谷 建一 中村 哲 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.522, pp.67-72, 2000-12-14
被引用文献数
5

近年, 音声認識の性能は大きく改善されたが, さらに, 音声のSNRが低い雑音環境での高い音声認識性能が求められている.そのような環境に適した音声認識システムとして, 音声情報と唇周辺の動画像を用いたバイモーダル音声認識が注目されている.このようなシステムを構築するためには, 音声情報と画像情報の統合が重要な問題となる.統合においては, (1)音声を発話する前に発声の準備のために唇が動き, 発話が終わった後に遅れて唇が閉じるといったような, 音声と唇周辺の動きの非同期性, (2)周辺環境に応じたシステムの適応化, といった問題がある.本稿では, まず(1)の問題に対し, 音声と唇周辺の動きの非同期性を考慮するHMM合成に基づいた統合を行う.次に(2)の問題に対しては, GPDアルゴリズムを用い, 少数の環境適応用のデータ(以下適応データ)からストリーム重みを推定することを検討する.音響的な雑音がある場合について, 単語認識実験を行った結果, 認識性能が改善されることが示された.
著者
沖 潤一 大見 広規 伊藤 淳一 宮本 晶恵 丸山 静男 奥野 晃正 鹿野 誠一
出版者
旭川医科大学
雑誌
旭川医科大学研究フォーラム (ISSN:13460102)
巻号頁・発行日
vol.2, no.2, pp.43-45, 2001

出版社版5歳6ヵ月女児.全身が冷たく意識障害があるとして母親に連れられて受診し,入院となった.入院時には全身的に新旧入り混じった多数の外傷を認めた.低体温の他,血管内凝固症候群を呈していることが検査にて明らかとなった.体温は直腸温で31.7℃と異常な低体温を示した.母親の言動,父親の態度及び不潔な皮膚や爪,低身長,低栄養状態などからネグレクト及び被虐待児症候群と診断した.知的発達の遅延,両親の生い立ち,夫婦関係に問題がることが判明した.児童相談所,保健所に連絡をとり,患児を保護しようと試みたが両親は虐待の事実を認めず住居を変更したため強制的な保護には至らなかった.保育所,小学校,警察防犯課,家庭裁判所,地方法務局とも相談を行った.情緒不安定を理由に児童相談所に収容し,患児が帰宅したくない意思を明らかにし,虚弱児施設に入所し10年以上が経過した
著者
長谷川 博 鹿野 真人 佐藤 栄需 金子 哲治 門馬 勉 武石 越郎
出版者
日本頭頸部癌学会
雑誌
頭頸部癌 (ISSN:13495747)
巻号頁・発行日
vol.32, no.4, pp.439-444, 2006-12-25 (Released:2008-05-30)
参考文献数
13
被引用文献数
2 3

高齢者の頭頸部癌治療では副作用が少なく,高い安全性と根治性が要求される。われわれは高齢者口腔癌に対し,ドセタキセル(TXT),シスプラチン(CDDP),ペプロマイシン(PEP),5-FUによるTCPF動注化学療法を行い,その安全性と有効性について検討した。2002年3月から2005年5月までTCPF動注化学療法を行った75歳以上の扁平上皮癌症例10例を対象とした。年齢は75~84歳,平均80歳。部位は舌口腔底8例,頬粘膜1例,上顎歯肉1例。全症例に浅側頭動脈か後頭動脈経由で動注用カテーテルを留置し,TCPF動注化学療法を行い,7例に生検切除を,2例に根治的切除を行った。原発部位に対する効果はCR率80%(8/10),PR率20%(2/10),pathological CR率67%(6/9)であった。副作用は,脳血管障害はなく,動注側の粘膜炎と脱毛が主であり,血液毒性など全身的な副作用はほとんど認めなかった。本療法の有効性と安全性は高く,ハイリスクの高齢者にも根治的治療として適応し得ると考えられた。
著者
竹内 翔大 ツィンツァレク トビアス 川波 弘道 猿渡 洋 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.129, pp.295-300, 2007-12-21
被引用文献数
2

実環境で頑健に動作する音声対話システムには多彩な発話表現を柔軟に処理できる対話制御技術が必要となる.多彩な発話表現に対して頑健な応答生成手法として,用例ベースの応答生成が研究されている.この手法では質問応答データベース (QADB) を用いて入力音声の認識結果に最も近い質問例を選択し,入力に対して最も適切な応答を生成する.これまで,QADB は発話データの書き起こし文を用いて作成されていた.本稿では,音声認識結果を用いた QADB (認識結果 QADB) による応答生成とその最適化を提案する.この手法により,入力に含まれる音声認識誤りに頑健な用例選択が行える.システム応答の適切さを応答正解率で評価した結果,6候補程度の認識結果を用いて QADB を作成し,最適化を行うことで,従来と同等以上の応答正解率が得られた.A speech-oriented dialog system employed in real-environment requires dialog control techniques which enable flexible processing of various utterance expressions. As a robust response generation method for various utterance expressions, an example-based response generation method has been studied. This method employs a question and answer database (QADB) to generate the most appropriate response by selecting an example question which is nearest to an input. Conventionally, a QADB is constructed from transcriptions of utterance data. In this paper, we propose response generation based on a question and answer database using automated speech recognition results (ASR-QADB), which enables to perform robust selection of examples against recognition errors. Evaluating the performance of system responses by response accuracy, the same response accuracy as with the conventional method is achieved by constructing and optimizing ASR-QADB using 6-best recognition results.
著者
中島 淑貴 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.107, pp.13-18, 2006-10-20

NAMマイクロホンにより収録されるNAMは,声質変換などの技術で,通常音声やささやき声に変換して無音声電話などの通信に使う方法があるが,NAMマイクロホン回路に,あるカットオフ周波数とスロープ特性をもつハイパスフィルタを組み込むことにより,出力は聴覚的に擬似的なささやき声様の音声となり,学習の必要がなく,ローコストでリソース消費のない通信利用が可能になる.今回我々は理想的なハイパスフィルタのカットオフ周波数とスロープを決めるために HPF-NAMの聴覚的な評価実験を行った.Non-Audible Murmur (NAM) can be used as an input interface for confidential telecommunication that annoys nobody due to its conversion to normal speech or a whisper voice using the technology of statistical voice conversion, so-called "non-speech telephony." Instead of using statistical voice conversion we installed an analog high-pass filter only of a resistor and a condenser into the NAM microphone amplifier circuit, and converted NAMs to a whisper-like voice (HPF-NAM) at presumably the lowest resource cost. In this paper we perform perceptual evaluations of naturalness and intelligibility on HPF-NAMs to determine the optimal cut-off frequency and filter slope of the high-pass filter.
著者
中山 彰 陸 金林 中村 哲 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.98, no.262, pp.57-62, 1998-09-11
被引用文献数
3

近年、ディジタル著作物の著作権を守る手段として電子透かし技術が開発されてきている。電子透かしは聴覚的には聴こえないということが重要であり、それを考慮した透かしアルゴリズムのひとつとしてLaurenceらの提案するMPEG心理音響モデルを用いた電子透かし法がある。ただこの方法は同時マスキングのみを考慮したものである。そこで本稿では心理音響実験の知見を用いて継時マスキングの定式化を行ない、それをLaurenceらの方法に導入し、もともとの方法との比較を行なった。その結果、両手法とも透かしの入った音楽でも高い品質を保っていることが明らかになった。また継時マスキングを組み込んだ場合の透かしの強度では、MPEGの符号化に対してLaurenceらの提案手法より、若干の改善が見られた。