著者
柳澤 絵美 荒井 隆行
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.71, no.10, pp.505-515, 2015-10-01 (Released:2017-06-02)

本研究の目的は,促音に先行する母音の出わたりにおける「フォルマント遷移の有無」と「インテンシティの減衰」が促音の知覚に影響を与えるか検証することである。この二つのパラメータ,及び,閉鎖区間を変化させた2音節の無意味語を合成し,聴取実験を行った。その結果,まず,閉鎖区間が長くなると,促音として知覚され易くなることが確認された。次に,フォルマント遷移がない刺激音は,促音として知覚されにくいことが分かり,フォルマント遷移が促音知覚の手がかりになっていることが明らかになった。更に,インテンシティの減衰の緩急は,促音の知覚には大きな影響を与えていないことが示唆された。
著者
井下田 貴子 廣谷 定男 荒井 隆行
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.21, no.2, pp.53-60, 2017-08-30 (Released:2018-02-28)
参考文献数
28

This study investigated overlapping of /o/ and /u/ in young Seoul Korean speakers' lenis/aspirated CV syllables, and discusses its results with previous studies' observations of overlapping in speech units of different length. Male speakers showed no overlapping in the lenis CV context, but did in the aspirated CV context. Females showed overlapping in both contexts, with greater overlapping in the aspirated. By comparing with previous V and read speech studies, it suggests that overlapping may be related to coarticulation and clarity reduction for males. For females, there is a possibility that the presence of C reduces overlapping in V.
著者
今富 摂子 荒井 隆行 加藤 正子
出版者
The Japan Society of Logopedics and Phoniatrics
雑誌
音声言語医学 (ISSN:00302813)
巻号頁・発行日
vol.44, no.4, pp.304-314, 2003-10-20 (Released:2010-06-22)
参考文献数
26
被引用文献数
1 2

開鼻声の聴覚判定における嗄声の影響を調べるため, 音源フィルタ理論に基づいて健常音声, 顕著な開鼻声, 軽度粗槌性嗄声, 重度粗槌性嗄声から, 4種類のフィルタ (顕著な開鼻声, 健常音声それぞれの/a/, /i/) と6種類の音源 (健常音源, 軽度粗慥性音源, 重度粗慥性音源それぞれの/a/, /i/) を組み合わせ, 24種類の音声刺激を合成し, 言語聴覚士を対象に, 5段階尺度で開鼻声の聴覚判定実験を行った.健常フィルタ, 顕著な開鼻声フィルタの両方で, 音源の種類によって開鼻声の判定値が変化した.特に重度粗槌性音源では, 顕著な開鼻声フィルタにおいて開鼻声の聴覚判定値が著しく低下した.軽度粗槌性音源では, フィルタの種類や聴取者によって, 結果にぼらつきが認められた.嗄声が開鼻声の聴覚判定値を変化させる要因として, 嗄声の音響特性によるスペクトルの変化が考えられるが, 詳細については今後検討が必要であると思われる.
著者
向 奈津美 金寺 登 北口 直 荒井 隆行
出版者
独立行政法人 石川工業高等専門学校
雑誌
石川工業高等専門学校紀要 (ISSN:02866110)
巻号頁・発行日
vol.39, pp.51-56, 2007

The process of detecting portions involving utterances, which is essential for captioning films, is generally carried out manually by translators at present. Robust methods are inevitable for automatic voice activity detection (VAD) in films involving other irrelevant sound information such as background music. This paper proposes a new feature for automatic VAD. The proposed method utilizes the gradient of spectrum in high-frequency domain (4-6kHz) and the standard deviation of modulation-filtered cepstrum. For evaluation experiments, we used a portion (about 23 minutes) of an English musical film. The proposed method exhibits a 22.6% reduction in total error rate compared to the conventional one utilizing the short time energy.
著者
高穂 洋 荒井 隆行 大竹 敢 田中 衛
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLP, 非線形問題 (ISSN:09135685)
巻号頁・発行日
vol.102, no.432, pp.13-16, 2002-11-06

株価の時系列データを用いて次期の株価を予測することは困難である.つまり,一因に株価の時系列データに有益でない成分が混在してることがあげられる.先行研究において,ローパスフィルタを用いて株価の時系列データから長周期成分を除去し,ニューラルネットワークにより予測を行ったところ,比較的正確な予測結果が得られた.本論文ではさらに日数の異なる移動平均線の比を求め,その周波数特性を検討し,バンドパス処理により予測に必要と考えられる特徴量の抽出を行った.また,提案方式による実験において従来の手法と比較し,より優れた予測性能が得られた.
著者
金寺 登 荒井 隆行 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1261-1269, 2001-07-01
被引用文献数
41

CMS法や動的特徴量を用いることにより, 音声認識性能が向上することが知られている. これらの手法では特徴パラメータの時間軌跡を操作している. この時間軌跡を周波数次元で表したものは変調スペクトルと呼ばれる. よってCMS法や動的特徴量は, 変調スペクトルを操作しているものとみなせる. また音声認識情報のほとんどが1〜16Hzの変調周波数バンドに存在することが明らかになってきた. そこで本研究では, 音声認識情報を担う変調スペクトル成分のみを特徴量として用い, 数字音声認識実験を行った. 広く用いられているRASTAではIIRフィルタを用いて約1〜12Hzの変調周波数バンドを抽出しているのに対し, 本論文では位相ひずみの少ないFIRフィルタを用いることにより認識性能が向上することを確認した. また, この特徴量と一般によく用いられている動的特徴量を含めたMFCCを種々の雑音環境(SNR 10dB)において比較した結果, 認識誤り率が平均3%改善されることを確認した. 更に重要な変調周波数バンドを複数のバンドに分割すると, 認識誤り率が平均8%改善された.
著者
荒井 隆行
出版者
上智大学
雑誌
基盤研究(C)
巻号頁・発行日
2015-04-01

音声の生成機構等を直感的に分かりやすく理解するため、子音と母音に関する模型を中心に教材・教育プログラムを開発した。子音は、鼻音・接近音・はじき音・破裂音・摩擦音を対象に模型の開発・評価を行った。母音は、日本語(音源も工夫し国内科学館にて企画展示)、エストニア語(海外博物館にて常設展示)に引き続き、ニーズの高い英語も対象とした。複数の子音を出すことが可能な屈曲式一体型模型については、毎年、改良を重ねた。見た目がより人間の解剖図に近いタイプでは、母音の声道形状を抽象化して静的モデルを開発し高評価を得た。千葉・梶山の測定に基づく屈曲式模型も製作。スライド式声道模型の普及のため、さらなる改良も重ねた。
著者
荒井 隆行
出版者
上智大学
雑誌
基盤研究(C)
巻号頁・発行日
2009

我々は今まで、音声の生成機構を直感的に理解できるような「声道模型」や「肺の模型」などを製作し、子ども向けの科学教室から大学での講義や講演に至るまで幅広く活用し、その有効性を実証してきた。模型にはそれぞれ一長一短があり、どの型が最善であるかは一概には言えない。そこで本研究では、目的や対象ごとに現状を調査してそれに基づいた改良を行うと共に、それまで実現できていなかった目的や対象に適した模型の設計・使用法の開発を行い、それらを評価した。
著者
辻 美咲 荒井 隆行 安 啓一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.69, no.4, pp.179-183, 2013-04-01
参考文献数
13

残響時間が長い環境では,情報伝達が困難となることがある。そのため,残響による影響を軽減させ,正しく情報伝達することが求められている。本研究は,残響下での聴き取りを改善するため,子音強調及び母音抑圧を施す前処理手法を提案する。処理音声に残響を畳み込んだ刺激を用いて単語了解度試験を行い,処理の効果を検討した。その結果,各子音部の最大振幅を1.0とし,各母音部の最大振幅を0.4〜1.0とした場合に関しては有意差はなかった。一方,各母音部の最大振幅を0.2とした場合に関しては有意に了解度が低下した。
著者
荒井 隆行 田中 希美 片岡 竜太
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.338, pp.143-148, 2008-12-02
参考文献数
14
被引用文献数
2

軟らかいゲル素材を用いて,軟口蓋が動き鼻咽腔閉鎖をする声道の物理模型を製作した.その模型では,軟口蓋から咽頭壁に渡ってゲル素材を用い,鼻腔を含むその他の部分はアクリル素材を用いた.4つの鼻咽腔閉鎖パターン(Coronal, Circular, Circular with Passavant's ridge, Sagittal)を模擬するため,ゲル素材の軟口蓋部にひもを付けると共に,両脇と後方からアクリル棒を押し込むことで咽頭側壁と咽頭後壁を動かせるようにした.これらの動作によって鼻咽腔閉鎖の度合いを連続的に変化させた結果,鼻咽腔結合部の開存面積に応じて模型から生成される音声信号の開鼻声の程度が変化することを確認すると共に,スペクトル上に極零対などが現れることを確認した.
著者
進藤 美津子 菅原 勉 荒井 隆行 飯田 朱美 平井 沢子 程島 奈緒 安 啓一 飯高 京子 川中 彰 進藤 美津子
出版者
上智大学
雑誌
基盤研究(A)
巻号頁・発行日
2004

私共は、平成16年度〜19年度にかけて、音声コミュニケーション障害者、高齢者、聴覚障害者、言語聴覚障害児者に対する支援システム、評価法の開発およびコミュニケーション援助の開発や臨床への応用を目的として、以下の3グループに分かれて研究を行ってきた。研究分担者や研究協力者は、文系と理系からなる学際的なメンバーで構成され、それぞれの専門性を活かした研究に取組み、成果を上げてきたことが特記される。3グループの研究は次の通りである。1.音声コミュニケーション障害者への支援システムの開発とコミュニケーション援助:神経筋病患者の自声による日英両言語のコミュニケーション支援システムの構築を行い、臨床への応用が可能であることを示した。コーパスベース方式でシステム構築を行った後、より少ないデータで構築可能なHMM音声合成方式でも試作を行い実用レベルに達するという評価結果を得た。2.聴覚障害者に対する支援システムの開発とコミュニケーション援助:聴覚障害児者や老人性難聴者のための残響環境下における聞きやすい拡声処理と補聴器のための音声処理方式の開発と実用化への適用を推進した。3.言語聴覚障害児者に対する支援システムの開発とコミュニケーション援助:高次脳機能に障害を持つ、後天性小児失語症児や中枢性聴覚障害児のコミュニケーション能力向上のための評価、指導法を開発し、発達性構音障害の鑑別診断となる基礎的研究と臨床への応用を行い、発達性読み書き障害児への基礎的、臨床的検討を行った。また、言語習得過程の不備からコミュニケーション障害が形成される可能性について問題提起した。
著者
金寺 登 荒井 隆行 岡田 賢治 浅井 健司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.103, no.155, pp.67-72, 2003-06-20

音声特微量の時間軌跡をフーリェ変換したものは変調スペクトルと呼ばれ,音声の認識には特定の変調スペクトルが重要であることが知られている.本報告ではよ音声認識にとって変調スペクトルの各成分がどの程度重要であるかを示す貢献度に応じて変調スペクトルを強調した音声認識特微量を提案する.自動音声認識実験の結果,提案した特微量は,雑音環境下において音声認識性能が約5%改善されることを確認した.
著者
金寺 登 Hynek Hermansky 荒井 隆行 船田 哲男
出版者
情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.120, pp.15-22, 1997-12-11

CMS法や動的特徴は変調周波数特性を操作することにより音声認識性能が向上することが知られているが、どの変調周波数がどの程度重要であるのかという定量的な検討は行われていない。そこで本研究では、様々な変調周波数特性を持った入力に対し、音声認識性能の違いを種々の雑音環境、認識方式、特徴量のもとで調べた。その結果、以下のことが分かった: ) 言語情報のほとんどが1?16 Hzの変調周波数帯域に存在し、その中でも4 Hz付近が最も重要である。) 変調スペクトルにおいては位相情報も重要である。) 4 Hz付近の変調周波数を含む特徴量を用いることで動的特徴量と同等以上の結果が得られる。) 適切な中心周波数と帝域幅をもつ複数のサブバンドを変調周波数上で用いることにより、認識性能がさらに向上する。We report on the effect of band-pass filtering of the time trajectories of spectral envelopes on speech recognition. Several types of recognizers, several types of features, and several types of filters are studied. Results indicate the relative importance of different components of the modulation spectrum of speech for ASR. General conclusions are: (1) most of the useful linguistic information is in modulation frequency components from the range between 1 and 16 Hz, with the dominant component at around 4 Hz, (2) it is important to preserve the phase information in modulation frequency domain, (3) The features which include components at around 4 Hz in modulation spectrum outperform the conventional delta features, (4) The features which represent the several modulation frequency bands with appropriate center frequency and band width increase recognition performance.