著者
廖 若辰 守脇 幸佑 槇原 靖 村松 大吾 武村 紀子 八木 康史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-218, no.17, pp.1-6, 2019-08-28

体組成は健康状況を把握するための重要な指標である.体脂肪率や体水分率,筋肉量などを把握することにより,肥満や生活習慣病の予防や改善が可能になり,現代社会における健康維持のためにその必要が増しつつある.市販の体組成計の多くは,生体電気インピーダンス分析法を用いるものが多く,正確な結果を出せる一方,設備が高価という問題点がある.また一人ずつしか計測できないため,多人数を効率よく計測するには不向きである.そこで,本研究では,多人数を効率よく計測するための,歩行映像解析による体組成推定を試みる.具体的には,歩行映像から抽出するシルエットに基づく特徴表現である歩容エネルギー画像 (Gait energy image, GEI) を入力,各体組成の値を出力とする畳み込みニューラルネットワーク (Convolutional neural network,CNN) を構成し,被験者の歩行映像から抽出した GEI と市販の体組成計で計測した体組成の値の組を学習データとして,ネットワークパラメタを学習する.ここで,体組成を計測できる被験者数には限りがあることから,CNN を適切に学習することが困難となる.そこで,まず,大規模歩行映像データベースから抽出した GEI を入力,同データベースから抽出可能な,体組成と関連性のありそうな歩容個性 (腕振りの大きさや歩幅) を出力とする CNN を事前学習する.次に,事前学習されたパラメタを持つ中間層までのネットワークに対して,いくかの層を追加した,即ち,構造的に成長させたネットワークの出力に体組成値を設定し,ネットワークのファインチューニングを行うことで,限られた体組成の学習データからでも効果的に学習可能なことを示す.実験では,体組成の学習データのみを用いた,サポートベクター回帰や CNN による推定手法と比較して,提案手法が高い精度を得られることを確認した.