著者
飯島 涼 南 翔汰 シュウ インゴウ 竹久 達也 高橋 健志 及川 靖広 森 達哉
雑誌
コンピュータセキュリティシンポジウム2018論文集
巻号頁・発行日
vol.2018, no.2, pp.17-24, 2018-10-15

市中で販売されている音声認識装置の多くは,人が発生した肉声のみならず,ダイナミックスピーカや,超音波を用いた指向性スピーカから再生される音声にも反応することが知られている.肉声ではない音声信号に反応することを悪用し,なりすましやリプレイ攻撃等の様々な攻撃が可能となる.本論文では,超音波を用いた高度な音声攻撃を提案する.鍵となるアイディアは変調した超音波を搬送波と側帯波に分離して放射することであり,2 つの波を標的のマイクに一致する点で交差させることにより,可聴音が聞こえる範囲を極小化する.その攻撃を X (Cross) - Audio Attack と名付け,その特性と有効性を主観評価実験により評価する.また,このような音声認識デバイスを標的にした攻撃への汎用的な対策手法として,超音波から発生する音声,ダイナミックスピーカが発生する音声,および人間の肉声を見分ける識別器,Voice Liveness Detector を提案する.作成した識別器の性能評価を行い,これまでに提案された音声認識への攻撃全てを検知でき,かつ高精度で攻撃検知が可能であることを示した.