著者
河原 達也 奥田 統己
出版者
京都大学
雑誌
挑戦的研究(萌芽)
巻号頁・発行日
2018-06-29

アイヌ民話(ウウェペケレ)の音声認識の研究に取り組んだ。2つの博物館から提供されたアイヌ語アーカイブのデータを元に、沙流方言を対象としたアイヌ語音声コーパスを構築した。このコーパスを用いてEnd-to-Endモデルに基づく音声認識システムを構成した。音素・音節・ワードピース・単語の4つの認識単位について検討し、音節単位が最もよいことを示した。音声認識精度が話者オープン条件において大幅に低下する問題に対して、CycleGANを用いた教師なし話者適応を提案した。さらに、日本語とアイヌ語が混合した音声に対して、音素認識と単語認識を組み合わせることで、アイヌ語の区間の検出(言語識別)を実現した。

言及状況

Twitter (3 users, 3 posts, 7 favorites)

樂するためには、かういふことを勉強する苦勞を取らねばならぬ ... https://t.co/iqzlL9oLGl

収集済み URL リスト