著者
小林 尊志 野田 雅文 出口 大輔 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.34, no.25, pp.129-130, 2010-06-29
参考文献数
3
被引用文献数
1

マイクロブログサービスTwitterでは,実際にスポーツを観戦したりTV番組を視聴したりしながらリアルタイムに書き込む"実況書き込み"が増加している.本報告では,実際に観戦・視聴していないユーザの書き込みなど,他の様々な書き込みの中からこれを検出する手法を提案する.実験ではTV番組において「番組によらない情報」と「番組固有の情報」に注目して単語の出現頻度を学習して実況書き込みの検出を行った.
著者
武田 一馬 川西 康友 平山 高嗣 出口 大輔 井手 一郎 村瀬 洋 柏野 邦夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J106-A, no.3, pp.58-69, 2023-03-01

本研究の目的は,多数の人物の視行動を分析することで,観衆が注目している複数の注目対象の位置の推定と,それらが注目されている度合(被注目度)を定量化することである.被注目度を推定する典型的な方法として,観衆の視線を推定し,その視線と物体の位置を対応付けることで,被注目度を推定することが考えられる.その場合,機器を設置するコストや手間をふまえると,観衆全体を一度に撮影した映像から視線を推定することが望ましい.しかし,このようにして撮影した映像から切り出した顔画像の解像度は観客ごとに撮影した場合と比べて小さく,視線推定精度は低い.そこで本論文では,低解像度でも比較的推定しやすい顔向きの時系列データを入力とし,これらを時空間的に統合することで,観衆が複数の注目対象を注視する状況下で注目対象の位置と被注目度を同時に推定する手法を提案する.提案手法の有効性を確認するため,アイドルのライブ公演を模したデータセットを構築し,注目対象の位置及び被注目度の推定精度を評価した.実験結果から,提案手法により比較手法と比べて被注目度の推定精度が向上することを確認した.
著者
浜田 玲子 井手 一郎 坂井 修一 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.79-89, 2002-01-01
参考文献数
19
被引用文献数
23

筆者らは, マルチメディアの中でもテキストの付随するマルチメディアに注目し, テキストからの情報を画像・音声解析に反映させることで, 実用的な精度のマルチメディア統合技術の実現を目指している.特に, 現在はテキスト教材の付随する料理番組に着目し, 料理映像とテキスト教材の対応付けシステムを開発している.本論文では, このような対応付けシステムの一部分であるテキスト解析部に焦点を当て, 調理手順の構造解析手法を提案した.本手法では, 解析対照の特徴を最大限に利用し, 実用的な処理を目指す.そのため, 対象に固有の辞書を構築し, これを利用した構造解析を行う.本論文では, 評価実験とその結果から, 本手法により高精度で調理手順の構造解析が可能であることを示した.なお, 本手法は付随する映像の存在しない調理手順文書などにも適用可能である.調理手順のような説明的文書は, 調理にとどまらずテキスト教材やインターネット上など様々なメディアから大量に入手可能であるが, それぞれが独自の書式で互いに独立に存在している.本手法は, 従来は難しかったこれらの膨大な情報の活用にも役立つものと考えられる.
著者
小笠原 崇 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.55-60, 2007-03-09

近年、大量に蓄積された映像データを効率的・効果的に利用するための技術が求められている。ニュース映像アーカイブにおいて、閲覧・検索のキーとなる重要な情報の一つとして映像中の登場人物がある。登場人物をキーとした映像の閲覧や検索を支援する技術は、従来から研究がなされているが、それらはもっぱら「名前」によってのみ人物を区別し、複数の呼称を持つ人物は、その呼称ごとに別々の人物として扱われてきた。本研究では、この問題に対処すべく、複数の呼称を持つ登場人物の同定(いわゆる"名寄せ")を行う手法の開発を行っている。名寄せは、言語処理や意味解析の高度化により、ある程度は実現できるが、「東国原知事」に対して「そのまんま東」のような通称を名寄せする場合など、言語処理での解決が困難な場面は多々ある。そこで、本手法では各呼称に対応付く人物の顔を利用することで、言語的な変化に影響されない枠組みでの名寄せを試みた。本報告では、5年半に渡り蓄積されたニュース映像アーカイブに対し本手法を適用した。結果から、本手法の名寄せ効果を確認した。
著者
清水 政行 川西 康友 出口 大輔 井手 一郎 村瀬 洋
出版者
公益社団法人 精密工学会
雑誌
精密工学会誌 (ISSN:09120289)
巻号頁・発行日
vol.87, no.5, pp.447-454, 2021-05-05 (Released:2021-05-05)
参考文献数
32

Estimation of translation between consecutive frames, i.e., odometry, plays an important role in autonomous navigation. This paper presents an odometry estimation method using sparse LiDAR points and image feature points. In case of sparse LiDAR measurements, it is difficult to accurately estimate depth at image feature points. Image feature points with low-accuracy depth cause misconvergence in odometry optimization. To improve the robustness to the misconvergence, a new method with a Gaussian process that estimates not only the depth at image feature points but also the variance is proposed. By using this variance, it estimates the residual of image features in the world coordinate with depth, or in the image coordinate without depth. This allows more accurate and robust estimation than conventional methods in case of sparse LiDAR points. In an experiment with simulated sparse LiDAR points from the KITTI dataset, the proposed method is confirmed to estimate the odometry more accurately than conventional methods.
著者
加藤 大貴 平山 高嗣 道満 恵介 井手 一郎 川西 康友 出口 大輔 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.5, pp.D-KC7_1-10, 2021-09-01 (Released:2021-09-01)
参考文献数
18

The Japanese language is known to have a rich vocabulary of mimetic words, which have the property of sound symbolism; Phonemes that compose the mimetic words are strongly related to the impression of various phenomena. Especially, human gait is one of the most commonly represented phenomena by mimetic words expressing its visually dynamic state. Sound symbolism is useful for modeling the relation between gaits and mimetic words intuitively, but there has been no study on their intuitive generation. Most previous gait generation methods set specific class labels such as “elderly” but have not considered the intuitiveness of the generation model. Thus, in this paper, we propose a framework to generate gaits from a mimetic word based on sound symbolism. This framework enables us to generate gaits from one or more mimetic words. It leads to the construction of a generation model represented in a continuous feature space, which is similar to human intuition. Concretely, we train an encoder-decoder model conditioned by a “phonetic vector”, a quantitive representation of mimetic words, with an adaptive instance normalization module inspired by style transfer. The phonetic vector is a dense description of the intuitive impression of a corresponding gait and is calculated from many mimetic words in the HOYO dataset, which includes gait motion data and corresponding mimetic word annotations. Through experiments, we confirmed the effectiveness of the proposed framework.
著者
振津 勇紀 出口 大輔 川西 康友 井手 一郎 村瀬 洋 向嶋 宏記 長峯 望
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J105-A, no.4, pp.48-57, 2022-04-01

重要な公共交通機関として広く社会に普及している鉄道の沿線には,信号機や踏切など列車の安全運行を支える多くの設備が設置されている.これらの設備の日常的な整備や設置状況などに関する情報収集業務の多くは人手により行われており,その維持管理作業の自動化・効率化を実現する技術が強く求められている.このような課題に対して,営業運転中の列車に搭載したカメラにより前方を撮影した列車前方映像のみを用い,セマンティックセグメンテーションを施すことで鉄道環境における沿線設備などを自動認識する技術に期待が寄せられている.しかし,セマンティックセグメンテーションでは画素単位でクラス情報を人手で付与した学習データが必要であり,高い性能を得るために必要な大量の学習データを用意するコストは非常に高い.そこで本論文では,教師なしデータに対するセマンティックセグメンテーション結果とStructure from Motion(SfM)法による3次元復元結果を組み合わせることによってラベル付き3次元点群を生成し,それらを画像平面に投影することで擬似的なデータ拡張を行うSfM-student法を提案する.これにより,限られたラベルあり学習データのみからセマンティックセグメンテーションの精度向上を図る.実際の鉄道環境で撮影したデータを用いた実験を行ったところ,提案する3次元情報を利用した擬似的なデータ拡張手法は既存のデータ拡張手法と比べてセマンティックセグメンテーション精度を向上させることを確認した.
著者
志土地 由香 井手 一郎 高橋 友和 村瀬 洋 SHIDOCHI Yuka IDE Ichiro TAKAHASHI Tomokazu MURASE Hiroshi
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.94, no.7, pp.532-535, 2011-07

類似した料理レシピ群における特徴的な調理手順の類似度に基づいて,代替可能な素材を発見する方法を提案する.これにより,利用者の要求に応じて料理レシピ中の素材を柔軟に置き換えられるようになることが期待される.
著者
井上 卓弥 平山 高嗣 高橋 友和 川西 康友 出口 大輔 井手 一郎 村瀬 洋 黒住 隆行 柏野 邦夫
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.138, no.11, pp.1399-1409, 2018-11-01 (Released:2018-11-01)
参考文献数
23
被引用文献数
1

Recently, the spread of Web cameras has facilitated video-conferencing as a means of communication. Since a Web camera is usually located outside the display while the user looks at his/her partner in the display, there is a problem that they cannot establish eye contact with each other. Various methods have been proposed to solve this problem, but most of them required specific sensors, and robust and accurate feature extraction for various appearances to densely associate facial feature points of the images. In this paper, we propose a method that transforms the eye areas to synthesize eye contact using a single camera that is commonly implemented in laptop computers. Concretely, we implemented a system which transforms the user's eye areas in an image to his/her eye image with a straight gaze to the camera only when the user's gaze falls in a range that the partner would perceive eye contact. We then confirmed the effectiveness of the proposed method in terms of accuracy of the gaze area classification, subjective evaluation score for eye contact, and accuracy of eye contact through experiments.
著者
井手 一郎 木下 智義 高橋 友和 孟 洋 片山 紀生 佐藤 真一 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.23, no.5, pp.282-292, 2008
被引用文献数
9 2

Recent increase of digital storage capacity has enabled the creation of large-scale on-line broadcast video archives. In order to make full use of the data in the archive, it is necessary to let a user easily grasp the availability of certain video data and their contents. Considering this problem, we have been investigating efficient and effective retrieval and reusing methodologies of archived video data. The archive used as a test-bed consists of more than 1,000 hours of news video obtained from a Japanese news program during the past six years. This paper first proposes a news topic tracking and structuring method. A structure called the `topic thread structure', is organized so that it should represent the temporal flow of news topics originating from a specified news story. The paper next introduces a browsing and editing interface that enables the user to browse through news stories along the topic thread structure, and also assists the compilation of selected news stories as a customized video summary or a documentary. The method was applied to the archived news video data in order to observe the quality of the topic thread structure and the usability of the prototype interface. As a result, some structures represented the flow of topics quite close to real-world comprehension. In addition, experiments showed that when the structure could be considered meaningful, the interface combined with the structure could drastically reduce the time needed to browse through the archive for news stories related to the user's interest.
著者
志土地 由香 井手 一郎 高橋 友和 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 = The transactions of the Institute of Electronics, Information and Communication Engineers. A (ISSN:09135707)
巻号頁・発行日
vol.94, no.7, pp.532-535, 2011-07-01
参考文献数
4
被引用文献数
2

類似した料理レシピ群における特徴的な調理手順の類似度に基づいて,代替可能な素材を発見する方法を提案する.これにより,利用者の要求に応じて料理レシピ中の素材を柔軟に置き換えられるようになることが期待される.
著者
野田 和広 高橋 友和 井手 一郎 目加田 慶人 村瀬 洋
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.367-372, 2006-03-17
参考文献数
10

本報告では,特定ジャンルの長時間放送映像から繰り返し区間を高速に検出する適応的特徴選択手法について述べる.長時間の放送映像には,CM やロゴ,重要なニュースなど,多くの繰り返し区間が存在する.これらを全て検出するためには,2 乗オーダで計算量が増加する繰り返し照合処理が必要となる.我々はこれまでに,低次元に圧縮した特徴空間内での繰り返し照合で候補を絞り込むことにより,計算量を抑制する手法を提案してきた.この手法により,長時間の一般放送映像からの繰り返し区間の検出を高速化できたが,固定された画面構成が多いジャンルの映像に適用した際に,低次元繰り返し照合による絞り込みの効果が小さかった.そこで本報告では,放送映像のジャンルに応じて適応的に画素を選択して特徴量を作ることにより,絞り込みの効果を向上させる手法を提案する.実験では5 つのジャンルの映像に対して,提案した画素選択法を用いた低次元繰り返し照合を行った.その結果,エントロピーを用いた画素選択法により,固定された画面構成が多いジャンルの映像における絞り込み効果の向上を確認した.In this paper, we propose an adaptive feature selection method to retrieve every single pair of repetitive segments in a long broadcast video stream whose genre is specified. We have previously proposed a fast retrieval method which narrows down the candidates of repetitive segments that need to be compared in detail, by an iterative comparing process in the compressed feature space. The computation time was actually cut down when this method was applied to a general broadcast video stream. However, when this method is applied to a video in which the composition of part of the picture is consistent, it did not always narrow down the candidates sufficiently. This report proposes a method to narrow down the candidates further by adaptively selecting pixels that represent the difference between segments according to the genre of the video stream. The result of an experiment showed that the method which selects the pixels by the entropy between frames narrows down the candidates best.
著者
小林 尊志 野田 雅文 出口 大輔 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.110, no.457, pp.165-169, 2011-02-28
参考文献数
6
被引用文献数
1

近年,Twitterに代表されるWebサービスの登場により,多くの人々が放送映像を視聴しながらリアルタイムに意見や感想を投稿するようになった.本報告では,Twitterを利用することで視聴者の意見を大量に自動で収集し,視聴者視点による要約映像の生成する手法を提案する.提案手法では,まず,視聴しながらリアルタイムに投稿されたTwitterの"実況書き込み"から,投稿者が応援するチームに関する属性を判別する.そして,同一チームを応援する視聴者の実況書き込みの状況から,視聴者の意見を反映した要約映像を自動で生成する.実験では,Twitterにおけるプロ野球の試合に関する実況書き込みを利用して中継映像の要約映像を生成し,提案手法の有効性を確認した.
著者
三浦 宏一 浜田 玲子 井手 一郎 坂井 修一 田中 英彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピュータビジョンとイメージメディア(CVIM) (ISSN:18827810)
巻号頁・発行日
vol.44, no.9, pp.21-29, 2003-07-15
被引用文献数
14

近年,マルチメディア情報を有効に活用する重要性が増すにつれ,テレビ映像の自動要約に関する研究がさかんに行われつつある.本論文では,料理映像を対象にした自動要約手法を提案し,検討する.我々は料理映像要約の目的を,調理の全体的な流れを視覚的・直感的に理解するのに十分な映像を作成することとしている.要約映像を作成する際には,映像の重要部分を抽出することが必要となるが,料理映像においては,調理動作および料理や食材の状態を示す部分が特に重要である.これらは画像全体の動きの激しさと関連があることから,オプティカルフローによりこれらの重要部分を検出する手法およびカメラワーク(パン)を除去する手法を提案し,評価実験によりその有効性を示した.さらに,この手法によって抽出された重要部分と,調理動作の中でも特に重要な繰返し動作部分から料理映像要約を生成するアプリケーションを実装した.放送局の異なる複数の料理番組に提案手法を適用し,要約映像を自動生成した結果,要約映像は十分に調理手順の内容を保ちつつ,元の映像の1/8 から1/12 の時間に短縮できた.また,自動要約した映像の一部を,番組制作者によって作成された要約映像と比較することにより,本手法の有効性を確認した.Re flecting the increasing importance of handling multimedia data efficiently, many studies are made on automatic abstraction of television broadcast video. In this paper, we propose a method to abstract cooking videos. We de fine cooking video abstraction as shrinking videos maintaining sufficient understandability of general cooking procedures visually and intuitively. To abstract a video, important sub-shot segments need to be extracted from the original video. Important segments in a cooking video are considered as cooking motions and appearances of foods, since visual information that represents essential cooking operation is exceptionally important. These segments have typical motion-related features. Thus,a method to extract such important segments referring to the intensity of motion in the image is proposed. Effectiveness of the method is shown through evaluation experiments. We also implemented an abstracted cooking video browser that assembles important segments detected by the proposed methods and repetitious motions that is especially important among cooking motions. The resultant abstracted videos were about 1/8 to 1/12 of the original videos in time, maintaining the understandability of cooking procedures. And the validity of the abstraction method was checked by comparing some automatic abstracted videos with abstracted videos provided from the broadcaster.
著者
渋久 奈保 高橋 友和 井手 一郎 村瀬 洋 小島 祥子 高橋 新
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.2, pp.215-225, 2009-02-01
被引用文献数
10

本論文では,事前に構築した距離データマップと走行中の自車が測定した距離データを対応づけることで,高精度に自車位置推定を行う手法を提案する.我々が考案した距離データマップとは絶対位置座標とその位置における車両走行方向の距離データ及び距離データの信頼性を対応づけたマップである.また,ここでいう距離データとは,4ラインレーザスキャナにより測定された車両前方の奥行方向の距離分布である.自車位置推定のために行う距離データマップと距離データの対応付けでは,精度向上をねらい,距離データ系列同士をDPマッチングで対応づける.複数の車線がある道路の同一区間を走行しながらGPSと同期して測定されたデータ系列を用いて,実験を行った.実験の結果から距離データ系列間の対応付けにより高精度な位置推定と走行車線分類が可能となることを確認した.
著者
小林 尊志 野田 雅文 出口 大輔 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学 (ISSN:09135685)
巻号頁・発行日
vol.110, no.456, pp.165-169, 2011-02-28
参考文献数
6

近年,Twitterに代表されるWebサービスの登場により,多くの人々が放送映像を視聴しながらリアルタイムに意見や感想を投稿するようになった.本報告では,Twitterを利用することで視聴者の意見を大量に自動で収集し,視聴者視点による要約映像の生成する手法を提案する.提案手法では,まず,視聴しながらリアルタイムに投稿されたTwitterの"実況書き込み"から,投稿者が応援するチームに関する属性を判別する.そして,同一チームを応援する視聴者の実況書き込みの状況から,視聴者の意見を反映した要約映像を自動で生成する.実験では,Twitterにおけるプロ野球の試合に関する実況書き込みを利用して中継映像の要約映像を生成し,提案手法の有効性を確認した.