- 著者
- 
             
             中野 倫靖
             
             緒方 淳
             
             後藤 真孝
             
             平賀 譲
             
          
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.48, no.1, pp.386-397, 2007-01-15 
- 被引用文献数
- 
             
             3
             
             
             
          
        
        本論文では,人がドラムの音を「ドンタンドドタン」のように擬音語で真似た音声(口ドラム)を,それに対応するドラムパターンとして認識する手法を提案する.口ドラムには,声質などの発声スタイルの個人差と表現の個人差の2 種類の個人差が存在し,認識手法はこれらの個人差を吸収できるものが望ましい.従来,実際のドラム音(楽器音)を対象とした認識は研究されてきたが,それらの手法では口ドラムの多様な個人差への対処が難しかった.そこで本手法では,口ドラムを,その各音を表す音素列の擬音語で表現し,多様な擬音語表現の辞書を用意することで,表現の個人差に対処する.さらに,音声認識で用いられている音響モデルを用いることにより,各歌唱者間の声質の個人差を吸収する.本手法を200 発話の口ドラムデータに対して適用した結果,最も良い実験条件において92.0%の認識率を得た.この結果は,提案手法が十分実用性を持つことを示しており,応用例として,口ドラムによるドラム譜入力インタフェースVoice Drummer を実装した.This paper presents a method of recognizing voice percussion (verbalized expression of drum sound by voice) as an expression of intended drum patterns. Recognition of voice percussion requires an approach that is different from existing methods for drum sound recognition. Individual differences in both vocal characteristics and the verbal expressions used add further complication to the task. The approach taken in this study uses phonemic sequences of onomatopoeia as internal representation of drum sounds. The set of onomatopoeia used in drum sounds are included in a pronunciation dictionary, and the phonemic sequences are estimated by utilizing an acoustic model. The acoustic model and the dictionary are intended to deal with the two types of individual differences mentioned above. In a recognition experiment with 200 utterances of voice percussion, our method achieved a recognition rate of 92.0% for the highest-tuned setting. Following the results of the proposed method, Voice Drummer, a music notation interface of drum sounds, was implemented, as a practical application for voice percussion recognition.