- 著者
- 
             
             峯松 信明
             
             広瀬 啓吉
             
             関口 真理子
             
          
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.43, no.7, pp.2186-2196, 2002-07-15 
- 被引用文献数
- 
             
             9
             
             
             
          
        
        対話システムの高度化にともない,入力音声から単に言語情報(文字情報)を抽出するだけでなく,話者性や感情など,話者の静的および動的特徴を的確に把握しながら効率的に対話を遂行することを目的とした研究が行われるようになってきた.本論文では種々の話者特性の中でも「年齢」に焦点を当てる.特に高齢化社会を考慮し,音声の音響情報より高齢話者を特定する手法を提案する.本論文ではまず,高齢話者音声データベースに対して聴取実験を行い,「高齢者であることを意識した対応が必要である」と考えられる話者を特定した(主観的高齢者).先行研究より高齢者としての特徴がスペクトル情報に反映されるとの知見があるので,主観的高齢者の同定を話者認識技術を利用して行った.その結果,約91%の正答率が得られた.さらに,聴取実験の結果得られた「高齢者としての対応が必要である」と判断した理由について分析し,スペクトル情報以外の音響情報である韻律的特徴を実験的に検討した.その結果,話速とパワーの局所変動を考慮することで,同定率を約95%まで向上することができた.また,提案手法に基づいて,発話者に対する主観的年代の自動推定に関する分析を行ったのでその結果についても報告する.Recent advancement of spoken dialogue systems requires techniques not only torecognize users' utterances, but also to capture their static and dynamiccharacters, with which more efficient and fruitful dialogue between humans andmachines can be realized. In the current paper, research focus is placed uponspeakers' agedness as one of the static characters and a method of automaticallyidentifying elderly speakers only with their voices is proposed. Firstly inthis paper, a listening test was done for JNAS and S-JNAS databases wheresubjects were asked to estimate each speaker's agedness subjectively and judgewhether the subjects should take special care of their speaking styles when talking tothe speakers. Secondly, a series of experiments were carried out to automaticallyidentify the subjectively-defined elderly speakers. In the first experiment,GMM-based speaker recognition techniques were immediately used and 91 %accuracy was obtained. Through experimental examinations of various prosodicfeatures, speech rate and local power perturbation were added to the GMM-basedidentification in the second experiment. The performance was raised up to 95 %.Finally, a method was also devised to estimate speakers' agedness using theproposed techniques. A rather high correlation between the agedness estimated bythe method and that obtained by the subjective listening test indicates thehigh validity of the method.