著者
Sun Mingfei 辻川 剛範 大西 祥史 Ma Xiaojuan 西野 淳 橋本 哲
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

瞬きやまぶたの垂れ下がりなど眼に関連した動きが眠気の顕著な症状であるとの報告は多くある。 しかしながら、これらの運きによって説明される眠気推定のための計算上の有効性を調査した者はほとんどいない。この論文では、まぶたの動きと眼球の動きの2つの典型的な動きを分析し、CNN-NetとCNN-LSTM-Netという異なるニューラルネットワークモデルを用いて調査する。 実験において、まぶたと眼球の両方の動きを用いることは、短時間での眠気推定において、まぶたの動きだけを用いるよりも良好な性能を示す。また眼球の動きのみを用いた場合、ベースライン(PERCLOS法)よりも悪化することを示す。 さらに、CNN-Netは、CNN-LSTM-Netよりも正確な眠気度の推定に有効であることを示す。
著者
谷 真宏 江森 正 大西祥史 越仲 孝文 篠田 浩一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.129, pp.85-89, 2007-12-20
被引用文献数
4

十分統計量を用いた教師なし話者適応において,選択する話者の数を決定する手法を提案する.音声認識における高速な教師なし話者適応の一つとして,話者毎の十分統計量を用いた手法が提案されている.これは,予め用意した複数の話者の中から,評価話者に音響的な特徴が近い話者を選択し,選択された話者の十分統計量を用いて,評価話者に適応した音響モデルを構築する手法である.従来手法では,評価話者に音響的な特徴が近い話者を選択する際,複数の話者の中から,予め定められた数だけ選択する.提案手法では,評価話者と予め用意した話者との音響特徴量空間における話者間距離を基準に,選択する話者の数を決定する.電話による対話音声を用いた認識実験において,従来手法に比較し,単語正解精度が 0.74 ポイント向上した.特に,音響的な特徴が近い話者が少ない評価話者に対して有効であることを確認した.We propose a new speaker selection method for the unsupervised speaker adaptation based on HMM sufficient statistics. The adaptation technique of using HMM sufficient statistics has been proposed as one of the rapid unsupervised speaker adaptation techniques in speech recognition. The procedure is as follows: First the training speakers acoustically close to the test speaker are selected. Then, the acoustic model is trained using the HMM sufficient statistics of these selected training speakers. In this technique, the number of selected training speakers is always constant. In our proposed speaker selection method, the number of speakers is determined by the distances between the test speaker and each training speaker. In our recognition experiments using spoken dialogue data, the proposed method improved word accuracy by 0.74 points. It was confirmed that the proposed method particularly effective when there are not many training speakers around the test speaker in acoustic space.