著者
西村 仁志 田坂 和之 川西 康友 村瀬 洋
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.73, no.5, pp.1004-1012, 2019 (Released:2019-08-26)
参考文献数
23

カメラ映像中の物体追跡では,物体の変形・遮蔽・回転等,様々な見えの変化が起こる状況でも高精度に追跡し続けることが求められる.本論文では,識別能力の高い相関フィルタと見えの変化に頑健な時系列フィルタを組み合わせた物体追跡手法を提案する.両フィルタを同時利用するために,相関フィルタによって得られた応答マップをパーティクルフィルタの観測モデルとして使用する.相関フィルタは,追跡している矩形領域をもとにパラメータを更新する.そのため,見えの変化が起こった際,追跡している矩形領域が追跡対象からずれ,誤った矩形領域を用いてパラメータを更新してしまう.提案手法では,追跡信頼度の低下によって見えの変化を検知した場合は複数の相関フィルタで追跡を行い,パーティクルフィルタの枠組みを用いて確率的に相関フィルタの更新を行う.これにより,誤った矩形領域を用いた相関フィルタの更新を低減する.実験では,追跡のAUCスコアについて,ベースライン手法が38.38%であったのに対し,提案手法では40.64%に向上し,提案手法の有効性が確認された.
著者
武田 一馬 川西 康友 平山 高嗣 出口 大輔 井手 一郎 村瀬 洋 柏野 邦夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J106-A, no.3, pp.58-69, 2023-03-01

本研究の目的は,多数の人物の視行動を分析することで,観衆が注目している複数の注目対象の位置の推定と,それらが注目されている度合(被注目度)を定量化することである.被注目度を推定する典型的な方法として,観衆の視線を推定し,その視線と物体の位置を対応付けることで,被注目度を推定することが考えられる.その場合,機器を設置するコストや手間をふまえると,観衆全体を一度に撮影した映像から視線を推定することが望ましい.しかし,このようにして撮影した映像から切り出した顔画像の解像度は観客ごとに撮影した場合と比べて小さく,視線推定精度は低い.そこで本論文では,低解像度でも比較的推定しやすい顔向きの時系列データを入力とし,これらを時空間的に統合することで,観衆が複数の注目対象を注視する状況下で注目対象の位置と被注目度を同時に推定する手法を提案する.提案手法の有効性を確認するため,アイドルのライブ公演を模したデータセットを構築し,注目対象の位置及び被注目度の推定精度を評価した.実験結果から,提案手法により比較手法と比べて被注目度の推定精度が向上することを確認した.
著者
浦西 友樹 五十川 麻理子 井下 智加 牛久 祥孝 大倉 史生 川西 康友 上瀧 剛
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.40, pp.1-7, 2018-05-03

本発表では,第 20 回画像の認識・理解シンポジウム (MIRU 2017) で行われた若手プログラムについて報告する.MIRU 2017 若手プログラムにおいては,プログラム応募者である若手研究者 46 名が 9 つの班に分かれ,班ごとに研究テーマについて議論し,研究を立ち上げた.MIRU 2017 大会期間中には研究テーマについてプレゼンテーションし,予選を通過した 4 つのグループが MIRU 2017 本大会で開催されたイベント中で研究計画を発表した.いくつかの班は MIRU 2017 終了後においても研究を継続し,研究成果が国際会議に採択されるなどの成果を挙げている.本稿では,若手プログラムの準備や大会期間中のイベントについて,実行委員会の視点から述べる.
著者
湯口 彰重 河野 誠也 石井 カルロス寿憲 吉野 幸一郎 川西 康友 中村 泰 港 隆史 斉藤 康己 美濃 導彦
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.40, no.10, pp.932-935, 2022 (Released:2022-12-24)
参考文献数
8

We propose an autonomous mobile robot Butsukusa, which describes its observations and internal states during the looking-around task. The proposed robot observes the surrounding environment and moves autonomously during the looking-around task. This paper examined several language generation systems based on different observation and interaction patterns to investigate better communication protocol with users.
著者
川西 康友 満上 育久 美濃 導彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.8, pp.1359-1367, 2011-08-01

本論文では屋外に設置された固定カメラを対象とし,太陽の動きによる日照の変動と看板やベンチなどの置かれ方に起因する構造の変動を再現した背景画像生成手法を提案する.この手法では,長期間観測して得た大量の画像を観測日と観測時刻という二つの観点で整理し,複数日・同時刻の観測画像に注目することで画像の日照成分を推定し,同日・複数時刻の観測画像に注目することで画像の構造成分を推定する.これにより,従来うまく背景画像を生成することができなかった日照の変化と構造の変化の両方を含むシーンにおいて,この二つの変化を同時に再現した背景画像生成を実現する.実験では従来手法と提案手法によって,様々な定点カメラによって得た画像に対して生成した背景画像を比較することで,本手法による背景画像生成の有効性を示した.
著者
清水 政行 川西 康友 出口 大輔 井手 一郎 村瀬 洋
出版者
公益社団法人 精密工学会
雑誌
精密工学会誌 (ISSN:09120289)
巻号頁・発行日
vol.87, no.5, pp.447-454, 2021-05-05 (Released:2021-05-05)
参考文献数
32

Estimation of translation between consecutive frames, i.e., odometry, plays an important role in autonomous navigation. This paper presents an odometry estimation method using sparse LiDAR points and image feature points. In case of sparse LiDAR measurements, it is difficult to accurately estimate depth at image feature points. Image feature points with low-accuracy depth cause misconvergence in odometry optimization. To improve the robustness to the misconvergence, a new method with a Gaussian process that estimates not only the depth at image feature points but also the variance is proposed. By using this variance, it estimates the residual of image features in the world coordinate with depth, or in the image coordinate without depth. This allows more accurate and robust estimation than conventional methods in case of sparse LiDAR points. In an experiment with simulated sparse LiDAR points from the KITTI dataset, the proposed method is confirmed to estimate the odometry more accurately than conventional methods.
著者
中村 泰貴 河野 誠也 湯口 彰重 川西 康友 吉野 幸一郎
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2022-NL-253, no.6, pp.1-7, 2022-09-22

ロボットをはじめとする人間を支援するシステムは,観測から状況を正しく理解し,人間が必要とする支援行動を出力する必要がある.特に人間を対象とした支援において,システムがどのような状況理解を行い,どのような動作行動の生成しようとしているかは,言語で表現することが重要である.そこで本研究では,現在の状況からシステムが行うべき行動を予測しその内容を言語で説明する,動作行動予測とその言語化 (captioning operative action) に取り組む.具体的には,ある状況とそこに対して何らかの支援行動が行われた理想状態の画像を入力とし,どのような支援行動が行われたかを説明する言語化タスクによって動作行動予測を実現するシステムを構築した.この際,こうした状況を説明する補助情報であるシーングラフの予測を補助タスクとして用いることで,シーングラフのアノテーションが存在しないテストセットに対しても精度高く動作行動の予測・言語化を行うことができることが確認された.
著者
加藤 大貴 平山 高嗣 道満 恵介 井手 一郎 川西 康友 出口 大輔 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.5, pp.D-KC7_1-10, 2021-09-01 (Released:2021-09-01)
参考文献数
18

The Japanese language is known to have a rich vocabulary of mimetic words, which have the property of sound symbolism; Phonemes that compose the mimetic words are strongly related to the impression of various phenomena. Especially, human gait is one of the most commonly represented phenomena by mimetic words expressing its visually dynamic state. Sound symbolism is useful for modeling the relation between gaits and mimetic words intuitively, but there has been no study on their intuitive generation. Most previous gait generation methods set specific class labels such as “elderly” but have not considered the intuitiveness of the generation model. Thus, in this paper, we propose a framework to generate gaits from a mimetic word based on sound symbolism. This framework enables us to generate gaits from one or more mimetic words. It leads to the construction of a generation model represented in a continuous feature space, which is similar to human intuition. Concretely, we train an encoder-decoder model conditioned by a “phonetic vector”, a quantitive representation of mimetic words, with an adaptive instance normalization module inspired by style transfer. The phonetic vector is a dense description of the intuitive impression of a corresponding gait and is calculated from many mimetic words in the HOYO dataset, which includes gait motion data and corresponding mimetic word annotations. Through experiments, we confirmed the effectiveness of the proposed framework.
著者
振津 勇紀 出口 大輔 川西 康友 井手 一郎 村瀬 洋 向嶋 宏記 長峯 望
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J105-A, no.4, pp.48-57, 2022-04-01

重要な公共交通機関として広く社会に普及している鉄道の沿線には,信号機や踏切など列車の安全運行を支える多くの設備が設置されている.これらの設備の日常的な整備や設置状況などに関する情報収集業務の多くは人手により行われており,その維持管理作業の自動化・効率化を実現する技術が強く求められている.このような課題に対して,営業運転中の列車に搭載したカメラにより前方を撮影した列車前方映像のみを用い,セマンティックセグメンテーションを施すことで鉄道環境における沿線設備などを自動認識する技術に期待が寄せられている.しかし,セマンティックセグメンテーションでは画素単位でクラス情報を人手で付与した学習データが必要であり,高い性能を得るために必要な大量の学習データを用意するコストは非常に高い.そこで本論文では,教師なしデータに対するセマンティックセグメンテーション結果とStructure from Motion(SfM)法による3次元復元結果を組み合わせることによってラベル付き3次元点群を生成し,それらを画像平面に投影することで擬似的なデータ拡張を行うSfM-student法を提案する.これにより,限られたラベルあり学習データのみからセマンティックセグメンテーションの精度向上を図る.実際の鉄道環境で撮影したデータを用いた実験を行ったところ,提案する3次元情報を利用した擬似的なデータ拡張手法は既存のデータ拡張手法と比べてセマンティックセグメンテーション精度を向上させることを確認した.
著者
井上 卓弥 平山 高嗣 高橋 友和 川西 康友 出口 大輔 井手 一郎 村瀬 洋 黒住 隆行 柏野 邦夫
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.138, no.11, pp.1399-1409, 2018-11-01 (Released:2018-11-01)
参考文献数
23
被引用文献数
1

Recently, the spread of Web cameras has facilitated video-conferencing as a means of communication. Since a Web camera is usually located outside the display while the user looks at his/her partner in the display, there is a problem that they cannot establish eye contact with each other. Various methods have been proposed to solve this problem, but most of them required specific sensors, and robust and accurate feature extraction for various appearances to densely associate facial feature points of the images. In this paper, we propose a method that transforms the eye areas to synthesize eye contact using a single camera that is commonly implemented in laptop computers. Concretely, we implemented a system which transforms the user's eye areas in an image to his/her eye image with a straight gaze to the camera only when the user's gaze falls in a range that the partner would perceive eye contact. We then confirmed the effectiveness of the proposed method in terms of accuracy of the gaze area classification, subjective evaluation score for eye contact, and accuracy of eye contact through experiments.
著者
井関 洋平 川西 康友 椋木 雅之 美濃 導彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J98-D, no.1, pp.236-249, 2015-01-01

様々な環境に設置された防犯カメラで観測された人物画像の特徴量は被写体の姿勢,照明などの撮影条件によって大きく変化する.そのため,特定人物画像検索における人物画像の特徴量比較には,撮影条件が異なれば(1)本来外見が類似している同一人物の人物画像の特徴量間の距離が大きくなる,(2)本来外見が類似していない別人同士の人物画像の特徴量間の距離が小さくなる,という二つの問題がある.従来提案されてきた適合性フィードバックでは,問題(1)には対応できるが問題(2)には対処できない.我々が提案する条件分割型適合性フィードバックでは,撮影条件を分類してフィードバックすることで,各撮影条件の画像特徴量が混合されることを回避し,問題(1)(2)の両方に対処できる.複数の防犯カメラ映像に対して人物画像を検索し,通常の適合性フィードバックと比較することで本手法の有効性を確認した.