著者
松田 勝敬 森 大毅 粕谷 英樹
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.56, no.7, pp.477-487, 2000-07-01
参考文献数
25
被引用文献数
3

ささやき声の低次のフォルマント周波数が, 通常発声に比べてわずかに高いことが知られている。本論文ではこの現象について, 声門下部系の結合を考慮した声道の電気回路モデルをもとに音響的に説明することを試みる。モデルにおける, 3次元声道形状は磁器共鳴画像(MRI)から測定した。その結果, 声門上部構造のせばめと, 声道と声門下部系との結合が低い周波数のフォルマントを上昇させる主な原因であることが分かった。
著者
松田 勝敬 森 大毅 粕谷 英樹
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.56, no.7, pp.477-487, 2000-07-01 (Released:2017-06-02)

ささやき声の低次のフォルマント周波数が, 通常発声に比べてわずかに高いことが知られている。本論文ではこの現象について, 声門下部系の結合を考慮した声道の電気回路モデルをもとに音響的に説明することを試みる。モデルにおける, 3次元声道形状は磁器共鳴画像(MRI)から測定した。その結果, 声門上部構造のせばめと, 声道と声門下部系との結合が低い周波数のフォルマントを上昇させる主な原因であることが分かった。
著者
森 大毅 有本 泰子 能勢 隆 永田 智洋
出版者
宇都宮大学
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

(1) 叫び声を誘発しやすいオンラインゲームをプレイする状況のコーパスを開発した。このコーパスには既存コーパスの10倍以上の頻度で叫び声が含まれている。叫び声の音響分析により、通常語彙や感動詞との音響的特性の違いを明らかにした。(2) 感情表出系感動詞の形態を分類し、多様な形態を持つ「あ」を合成した。合成音声を用いた知覚実験により、形態とパラ言語情報との関係を明らかにした。(3) 自然対話コーパスから笑い声の構成要素の変動要因を明らかにするとともに、コーパスベース音声合成を応用した多様な笑い声合成を実現した。知覚実験により、定義した変動要因を考慮することにより自然性が向上することがわかった。
著者
永岡 篤 森 大毅 有本 泰子
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.73, no.11, pp.682-693, 2017

<p>感情音声コーパスに付与されている感情ラベルには,次元で記述されたものとカテゴリで記述されたものがあり,これらには互換性がない。複数コーパスを統合し大規模なコーパスとして扱うためには感情ラベルの共通化が必要であるが,人手による感情ラベル付与はコストが高い。音声からの感情認識の技術を利用すれば異種感情ラベルの自動付与が可能だが,その推定精度は十分とは言えない。本論文では,音声から得られる特徴量に加え,それぞれの感情音声コーパスにもともと付与されている感情ラベルをも推定器への入力として利用した異種感情ラベル推定手法を提案する。まず,感情カテゴリラベルを持つコーパスOGVCに対する感情次元ラベルの推定実験を行った。モデル学習用のコーパスに付与されている感情ラベルとしては,次元とカテゴリの両方が利用できる場合,及び次元だけが利用できる場合についてそれぞれ検討した。次に,感情次元ラベルを持つコーパスUUDBに対する感情カテゴリラベルの推定実験を同様に実施した。実験の結果,対象コーパスにもともと付与されている感情ラベルの併用により,異種感情ラベルの推定精度を向上できることが示された。特に,UUDBに対する感情カテゴリラベルの推定においては,モデル学習用のコーパスが感情次元ラベルを持たず,推定された感情次元ラベルで代用した場合でも,推定精度を改善できることが分かった。</p>
著者
松田 勝敬 森 大毅 粕谷 英樹
出版者
日本音声学会
雑誌
音声研究 (ISSN:13428675)
巻号頁・発行日
vol.3, no.3, pp.67-75, 1999-12-30
被引用文献数
1

The lower formant frequencies of whispered vowels are known to be slightly higher than those of modal vowels. This paper attempts to interpret this phenomenon acoustically, based on an electrical circuit model of the vocal tract. Perceived naturalness of whispered vowels is shown to be associated with bandwidth of the lower formant and spectral tilt resulting from loose acoustic coupling between supra- and sub-glottal systems through a small glottal chink. Perceptual significance of the frequency shift of the lower formant in whispered vowels is also studied. Perceptual experiments showed in that vowel boundaries between modal and whispered vowels were not changed in four of six subjects for the /o/-/a/ stimuli and in two of six for the /i/-/e/ stimuli. The results indicated that frequency shift of the lower formant in whispered vowels is not necessarily associated with the compensation for vowel boundary shifts.
著者
森 大毅 粕谷 英樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.55, pp.55-62, 2001-06-01
被引用文献数
2

音声対話システムのための言語モデルとしてsuperwordモデルを提案しており、パープレキシティの点で優れていることがわかっている。本報告では、音声対話システムの応答タイミングの高度な制御を目的として、superwordに基づく話者交替の予測モデルを提案する。話者交替/非交替のキューとなる表現の抽出のため、superword確率から計算されるキューの強度を定義した。キューの強度に従って抽出したsuperwordには、話者交替に関係があると思われる表現が多く含まれていた。また、一部のタスクに対してはキューの強度分布が実際の話者交替/非交替によって異なることから、提案した予測モデルの有効性が示された。The superword model is a data-driven framework for dialogue modeling and its superiority was shown in our previous works. In this report, we propose a superword-based turn-taking prediction model for precise control of responce timing of spoken dialogue systems. First, cue intensity is defined with superword probability in order to extract cue expressions for turn-taking or turn-holding. Extracted superword set is shown to include a lot of relevant expressions to turn-taking. Finally, the effectiveness of the proposed prediction model for some tasks has been revealed by showing the difference of cue distribution according to actual turn-taking / turn-holding.
著者
森 大毅 阿曽 弘具 牧野 正三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1994, no.63, pp.89-96, 1994-07-21
被引用文献数
5

trigramモデルは自然言語の局所的性質の良い近似となっており、パターン認識全般において広く用いられている。本報告では、日本語文書中の文字系列のtrigramモデルを用いた文字認識後処理の手法について述べ、実際に文字認識実験を行うことでその有効性を明らかにする。新聞の社説を統計処理することによりモデルを構築し、そのしぼり込み効果をパープレキシティを用いて評価する。その際2種類のスムージング法を導入し、削除補間法を用いた場合の予測性能が優れていることを示す。3種類の文書に対して文字認識後処理を適用した結果、誤字の回復率が75%から90%以上と高い効果が得られた。Being a good representation of local feature of natural languages, trigram model is widely applied to various pattern recognition system. In this report, a postprocessing method for character recognition using the trigram model of the character sequences in Japanese documents is described, and its advantage is revealed by practical experiments. The model is trained by statistical processing of leading articles, then the ability to reduce ambiguity is evaluated by the perplexity. In this procedure, two smoothing methods are introduced, and the predictive power of deleted interpolation method is shown to be superior. Experimental results of postprocessing for three kinds of documents show that the correction rates are 75 to over 90 percent.