著者
武田 一馬 川西 康友 平山 高嗣 出口 大輔 井手 一郎 村瀬 洋 柏野 邦夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J106-A, no.3, pp.58-69, 2023-03-01

本研究の目的は,多数の人物の視行動を分析することで,観衆が注目している複数の注目対象の位置の推定と,それらが注目されている度合(被注目度)を定量化することである.被注目度を推定する典型的な方法として,観衆の視線を推定し,その視線と物体の位置を対応付けることで,被注目度を推定することが考えられる.その場合,機器を設置するコストや手間をふまえると,観衆全体を一度に撮影した映像から視線を推定することが望ましい.しかし,このようにして撮影した映像から切り出した顔画像の解像度は観客ごとに撮影した場合と比べて小さく,視線推定精度は低い.そこで本論文では,低解像度でも比較的推定しやすい顔向きの時系列データを入力とし,これらを時空間的に統合することで,観衆が複数の注目対象を注視する状況下で注目対象の位置と被注目度を同時に推定する手法を提案する.提案手法の有効性を確認するため,アイドルのライブ公演を模したデータセットを構築し,注目対象の位置及び被注目度の推定精度を評価した.実験結果から,提案手法により比較手法と比べて被注目度の推定精度が向上することを確認した.
著者
岩井 儀雄 勞世竑 山口 修 平山 高嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.343-368, 2005-05-13
参考文献数
222
被引用文献数
24

画像処理による顔情報処理に関連した研究について,1)顔検出法 2)イメージベースの顔認識法 3)モデルベースの顔認識法 という観点に基づき最近の動向を紹介する.In this paper, we survey research on facial image processing. We explain the followings: 1) face detection, 2) image-based face recognition, and 3) model-based face recognition.
著者
岩井 儀雄 勞世竑 山口 修 平山 高嗣
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.38(2005-CVIM-149), pp.343-368, 2005-05-13

画像処理による顔情報処理に関連した研究について,1)顔検出法 2)イメージベースの顔認識法 3)モデルベースの顔認識法 という観点に基づき最近の動向を紹介する.
著者
平山 高嗣 岩井 儀雄 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.6, pp.1625-1634, 2003-06-15
被引用文献数
5

顔画像を利用したヒューマンインタフェースを構成する場合,システムがユーザに拘束条件を与えないことが理想の形態となる.顔はその姿勢や表情により,その見え方が様々に変化するため,この変化にロバストな認識技術が必要になる.本研究では,入力画像中の顔領域と照合に用いるモデルの大きさが異なる場合でも,顔認識が可能となる照合手法を提案する.これはフレキシブル特徴照合法を拡張した手法で,照合に用いる特徴量が顔の大きさの変化に対して正規化されるため,顔認識の精度を保つことができる.特徴量の正規化には,顔の大きさの確率的な推定手法と効率的な処理を行うために改良したガボールウェーブレット変換を用いる.我々は提案手法に基づいた個人識別システムを構築し,個人識別実験によりその有効性を検証した.Facial recognition technology needs to be robust for arbitrary facial appearances because a face changes according to facial expressions and facial poses. In this paper, we propose a method which automatically performs face recognition for variously scaled facial images. The method performs flexible feature matching using features normalized for facial scale. For normalization, the facial scale is probabilistically estimated and is used as a scale factor of an improved Gabor wavelet transformation. We implement a face recognition system based on the proposed method and demonstrate the advantages of the system through facial recognition experiments.
著者
加藤 大貴 平山 高嗣 道満 恵介 井手 一郎 川西 康友 出口 大輔 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.5, pp.D-KC7_1-10, 2021-09-01 (Released:2021-09-01)
参考文献数
18

The Japanese language is known to have a rich vocabulary of mimetic words, which have the property of sound symbolism; Phonemes that compose the mimetic words are strongly related to the impression of various phenomena. Especially, human gait is one of the most commonly represented phenomena by mimetic words expressing its visually dynamic state. Sound symbolism is useful for modeling the relation between gaits and mimetic words intuitively, but there has been no study on their intuitive generation. Most previous gait generation methods set specific class labels such as “elderly” but have not considered the intuitiveness of the generation model. Thus, in this paper, we propose a framework to generate gaits from a mimetic word based on sound symbolism. This framework enables us to generate gaits from one or more mimetic words. It leads to the construction of a generation model represented in a continuous feature space, which is similar to human intuition. Concretely, we train an encoder-decoder model conditioned by a “phonetic vector”, a quantitive representation of mimetic words, with an adaptive instance normalization module inspired by style transfer. The phonetic vector is a dense description of the intuitive impression of a corresponding gait and is calculated from many mimetic words in the HOYO dataset, which includes gait motion data and corresponding mimetic word annotations. Through experiments, we confirmed the effectiveness of the proposed framework.
著者
赤井 直紀 モラレス ルイス 洋一 平山 高嗣 村瀬 洋
出版者
公益社団法人 計測自動制御学会
雑誌
計測自動制御学会論文集 (ISSN:04534654)
巻号頁・発行日
vol.55, no.11, pp.745-753, 2019 (Released:2019-11-20)
参考文献数
29

This paper presents a localization approach that simultaneously estimates a robot's pose and class of sensor observations, where “class” categorizes the sensor observations as those obtained from known and unknown objects on a given geometric map. The proposed approach is implemented using Rao-Blackwellized particle filtering algorithm. The robot's pose can be robustly estimated utilizing sensor observations obtained from the only known objects by the simultaneous estimation. The proposed approach is efficient in terms of computational complexity because its complexity is same as that of the likelihood field model. Performance of the proposed approach was shown through experiments using a 2D LiDAR simulator.
著者
森田 純哉 平山 高嗣 間瀬 健二 山田 和範
雑誌
研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:21888698)
巻号頁・発行日
vol.2015-UBI-47, no.16, pp.1-6, 2015-07-20

これまで発表者らは,パーソナルデータを用いた自伝的記憶のモデル構築,およびそれを組み入れた写真スライドショーアプリの開発に取り組んできた.本発表では,アプリの背景にあるモデルベース回想法のコンセプトを議論する.モデルベース回想法は,(1) 認知アーキテクチャによるユーザモデリング,(2) ユーザフィードバックによるモデル学習,(3) モデルによるユーザの働きかけを要素とする.個人化された認知モデルによって,ユーザに写真が提示され,ユーザからのフィードバックによってモデルがチューニングされる.その結果として,人間とモデルの同調,あるいはモデルによる人間の連想の引き込みが生じる.こういったモデルベース回想法の方法論を完成させることで,ユーザの記憶想起をポジティブな方向へ導き,建設的な未来展望へつなげるシステムが構築されると考えている.
著者
井上 卓弥 平山 高嗣 高橋 友和 川西 康友 出口 大輔 井手 一郎 村瀬 洋 黒住 隆行 柏野 邦夫
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.138, no.11, pp.1399-1409, 2018-11-01 (Released:2018-11-01)
参考文献数
23
被引用文献数
1

Recently, the spread of Web cameras has facilitated video-conferencing as a means of communication. Since a Web camera is usually located outside the display while the user looks at his/her partner in the display, there is a problem that they cannot establish eye contact with each other. Various methods have been proposed to solve this problem, but most of them required specific sensors, and robust and accurate feature extraction for various appearances to densely associate facial feature points of the images. In this paper, we propose a method that transforms the eye areas to synthesize eye contact using a single camera that is commonly implemented in laptop computers. Concretely, we implemented a system which transforms the user's eye areas in an image to his/her eye image with a straight gaze to the camera only when the user's gaze falls in a range that the partner would perceive eye contact. We then confirmed the effectiveness of the proposed method in terms of accuracy of the gaze area classification, subjective evaluation score for eye contact, and accuracy of eye contact through experiments.
著者
丸谷 宜史 間瀬 健二 平山 高嗣
出版者
人工知能学会
雑誌
研究報告 ヒューマンコンピュータインタラクション(HCI) (ISSN:13479881)
巻号頁・発行日
vol.2011, no.4, pp.1-4, 2011-05-20

多視点スポーツ映像はスポーツ映像を自由な視点から見ることを可能にする一方で,視聴者にとっては視点やシーン選択の自由度が増えるため,見たいシーンの選択に負担がかかる.このため,ハイライトシーンを提示することで視聴を支援することは重要である.本研究ではスポーツ映像としてフィギュアスケートを対象とし,選手の演技内容をタグとして付加することでハイライトシーンを提示することを目指す.その実現のため,撮影と同期してリンク上の選手の状態をレンジスキャナにより計測し,獲得したレンジデータに対して演技に応じた処理を行うことで選手の演技を検出する手法について検討を行った.It is necessary to support viewing multiple view sports videos because there are so many view points and scenes in the multiple view sports videos.We aim to tag scenes on the multiple view sports videos according to players' actions in order to support viewing the multiple view sports videos. To achieve this goal, we use range scan camera to capture player's position data without using wearable sensors. By processing the range data according to the players' actions, we segment the multiple view sports videos into scenes.
著者
臼井 翔平 鳥海 不二夫 松尾 真人 平山 高嗣 間瀬 健二
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

ソーシャルメディアは2011年3月11日に発生した東日本大震災時に,非常に有力なツールとして,情報の拡散や収集に用いられた.現在ソーシャルメディアを新たな情報源として確立するため,ソーシャルメディア内に構築される友人ネットワーク上での情報拡散を対象とした研究が数多く行われている.本研究では,友人ネットワークの構造に着目し,構造の違いが情報拡散に及ぼす影響を分析する.
著者
佐竹 純二 小林 亮博 平山 高嗣 川嶋 宏彰 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.137-142, 2008-02-14
被引用文献数
7

本研究では,大型ディスプレイを用いた情報提示システムにおいて,ユーザの顔や視線の方向を推定し,ユーザの興味や反応を認識することで,コンテンツをインタラクティブに制御することを目指している.カメラ画像のみを用いた視線推定法では,視線を虹彩中心と眼球中心を結ぶ直線として求める方法が一般的であるが,目領域の解像度が低いために誤差の影響が大きかった.そこで,高解像度カメラ(UXGA 30fps)を導入し,角膜による屈折を考慮した詳細な虹彩形状モデルを用いて,より高精度に視線を推定する方法を報告する.
著者
岩井 儀雄 勞世竑 山口 修 平山 高嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.343-368, 2005-05-13
参考文献数
222
被引用文献数
24

画像処理による顔情報処理に関連した研究について,1)顔検出法 2)イメージベースの顔認識法 3)モデルベースの顔認識法 という観点に基づき最近の動向を紹介する.In this paper, we survey research on facial image processing. We explain the followings: 1) face detection, 2) image-based face recognition, and 3) model-based face recognition.