著者
金寺 登 荒井 隆行 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1261-1269, 2001-07-01
被引用文献数
41

CMS法や動的特徴量を用いることにより, 音声認識性能が向上することが知られている. これらの手法では特徴パラメータの時間軌跡を操作している. この時間軌跡を周波数次元で表したものは変調スペクトルと呼ばれる. よってCMS法や動的特徴量は, 変調スペクトルを操作しているものとみなせる. また音声認識情報のほとんどが1〜16Hzの変調周波数バンドに存在することが明らかになってきた. そこで本研究では, 音声認識情報を担う変調スペクトル成分のみを特徴量として用い, 数字音声認識実験を行った. 広く用いられているRASTAではIIRフィルタを用いて約1〜12Hzの変調周波数バンドを抽出しているのに対し, 本論文では位相ひずみの少ないFIRフィルタを用いることにより認識性能が向上することを確認した. また, この特徴量と一般によく用いられている動的特徴量を含めたMFCCを種々の雑音環境(SNR 10dB)において比較した結果, 認識誤り率が平均3%改善されることを確認した. 更に重要な変調周波数バンドを複数のバンドに分割すると, 認識誤り率が平均8%改善された.
著者
船田 哲男 続木 貴史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.2184-2187, 1999-11-25
被引用文献数
9

耐雑音性をもった特徴を音声から抽出することを目的とし,パワースペクトルの周波数軸に関する傾斜に着目した特徴量を提案した.この特徴抽出過程で行うスペクトル傾斜に対するしきい値操作が,耐雑音性に効果をもつことを,単語音声認識実験で確認した.
著者
寒野 徹 高橋 俊文 渕上 靖史 船田 哲 岡田 崇 東 義人 山田 仁
出版者
日本泌尿器内視鏡学会
雑誌
Japanese Journal of Endourology (ISSN:21861889)
巻号頁・発行日
vol.31, no.2, pp.218-222, 2018 (Released:2019-07-27)
参考文献数
10
被引用文献数
2

【目的】寝たきり患者の尿路結石の対処法は定まっていない. 閉塞性腎盂腎炎治療後の寝たきり患者の外科的結石除去術の安全性と効果を明らかにすることを目的とした. 【対象と方法】2010年以降に閉塞性腎盂腎炎で入院した80例を対象とした. 術後全生存期間と腎盂腎炎再発を起こさない割合をカプランマイヤー法で解析した. 【結果】67例において閉塞性腎盂腎炎治療後に結石外科的治療 (TUL49例, PNL8例, ESWL7例, 腎摘4例) を施行した. 年齢中央値は81歳, 女性の割合は69%であった. 周術期合併症は18例 (27%) に認めた. 3年の全生存率は78%, 腎盂腎炎非再発率は69%であった. 【結語】閉塞性腎盂腎炎治療後の寝たきり患者の手術は合併症率の増加を認めるものの手術可能であった. 腎盂腎炎の再発は3年で約30%認めた.
著者
越智 敦彦 直井 牧人 江夏 徳寿 藤崎 明 船田 哲 鈴木 康一郎 志賀 直樹 太田 智則 久慈 弘士 細川 直登 岩田 健太郎
出版者
一般社団法人 日本泌尿器科学会
雑誌
日本泌尿器科学会雑誌 (ISSN:00215287)
巻号頁・発行日
vol.102, no.4, pp.644-648, 2011 (Released:2012-08-09)
参考文献数
7

連鎖球菌感染の内,特にA群溶血性連鎖球菌による壊死性筋膜炎は短時間に敗血症性ショック,多臓器不全から死に至る可能性がある重症感染疾患であり,救命には早期かつ適切な治療(壊死組織のデブリードマンと抗菌薬加療)が要求される.デブリードマンされた組織の鏡検にて連鎖球菌を認めた場合,それがA群溶血性連鎖球菌であるかどうかは,培養結果を待つことなく咽頭用の迅速A群溶血性連鎖球菌抗原検出キット(ストレップA)を用いることで予想することができる. 今回我々は,この検査キットを使用することで早期にA群溶血性連鎖球菌感染症と判断し得た,61歳男性の陰部に発症した壊死性筋膜炎(フルニエ壊疽)の1例を経験した.その起炎菌の早期同定が,適切な外科的処置と抗菌薬の選択を可能とし,救命に繋がったと考えられたため報告する.
著者
宮林 穎夫 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.239, pp.25-32, 2000-07-20
被引用文献数
1

音声の基本的特徴であるピッチ周波数の検出は、音声分析合成を行う上で、最も重要な研究課題の一つである。本論文では、連続音声の有声/ 無声判定およびピッチ抽出に, 我々の提案する帯域フィルタ対(BPFP)バンクを利用する方法が、ピッチ周期の乱れやピッチごとの波形変動、雑音付加に対してどのような性能を示すかを, ケプストラム法や変形相関法と比較し検討する。実験の結果, BPFP法は他の代表的な手法であるケプストラム法や変形相関法と比べて, 性能が比較的安定し有効なピッチ抽出法であることと, BPFPバンク中心周波数間隔の対数化によって, 特に低周波数帯域で効果があらわれることがわかった。また, BPFPバンクと組み合わせたNN法は, 設定が困難なU/V判定のための閾値をいちいち決めなくても, NN学習により逐次U/V判定を行うことができる利点を明らかにした。
著者
宮林 穎夫 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.178, pp.29-36, 1998-07-17

音声の基本的特徴であるピッチ周波数の検出は, 音声分析合成を行う上で, 最も重要な研究課題の一つである.本論文では, 連続音声の有声/無声判定およびピッチ抽出に, 我々の提案する帯域フィルタ対(BPFP)バンクを利用する方法が, ピッチ周期の乱れやピッチごとの波形変動, 雑音付加に対してどのような性能を示すかを, ケプストラム法や変形相関法と比較し検討する.実験の結果, BPFP法は他の代表的な手法であるケプストラム法や変形相関法と比べて, 性能が比較的安定し有効なピッチ抽出法であることと, BPFPバンク中心周波数間隔の対数化によって, 特に低周波数帯域で効果があらわれることがわかった.
著者
宮林 穎夫 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.101, no.94, pp.7-12, 2001-05-18
被引用文献数
1

本論文では, 我々が提案する帯域フィルタ対(BPFP)バンクを利用する方法(BPFP法)やBPFPバンクとニューラルネットワーク(NN)を組み合わせた方法(BPFP-NN法)において, 耐雑音性の向上策として, パワースペクトルの周波数方向の傾斜を3値化するための閾値をBPFP内に導入する. 白色雑音やピンク雑音を付加した実音声に対して, BPFP法, BPFP-NN法による有声/無声判定およびピッチ抽出がどのような性能を示すかを, 変形相関法などの既存の方法と比較し検討する. 実験の結果,BPFP法, BPFP-NN法は変形相関法などと比べて遜色のない有声/無声判定付きピッチ抽出法であることがわかった.
著者
金寺 登 Hynek Hermansky 荒井 隆行 船田 哲男
出版者
情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.120, pp.15-22, 1997-12-11

CMS法や動的特徴は変調周波数特性を操作することにより音声認識性能が向上することが知られているが、どの変調周波数がどの程度重要であるのかという定量的な検討は行われていない。そこで本研究では、様々な変調周波数特性を持った入力に対し、音声認識性能の違いを種々の雑音環境、認識方式、特徴量のもとで調べた。その結果、以下のことが分かった: ) 言語情報のほとんどが1?16 Hzの変調周波数帯域に存在し、その中でも4 Hz付近が最も重要である。) 変調スペクトルにおいては位相情報も重要である。) 4 Hz付近の変調周波数を含む特徴量を用いることで動的特徴量と同等以上の結果が得られる。) 適切な中心周波数と帝域幅をもつ複数のサブバンドを変調周波数上で用いることにより、認識性能がさらに向上する。We report on the effect of band-pass filtering of the time trajectories of spectral envelopes on speech recognition. Several types of recognizers, several types of features, and several types of filters are studied. Results indicate the relative importance of different components of the modulation spectrum of speech for ASR. General conclusions are: (1) most of the useful linguistic information is in modulation frequency components from the range between 1 and 16 Hz, with the dominant component at around 4 Hz, (2) it is important to preserve the phase information in modulation frequency domain, (3) The features which include components at around 4 Hz in modulation spectrum outperform the conventional delta features, (4) The features which represent the several modulation frequency bands with appropriate center frequency and band width increase recognition performance.