著者
小林 尊志 野田 雅文 出口 大輔 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.34, no.25, pp.129-130, 2010-06-29
参考文献数
3
被引用文献数
1

マイクロブログサービスTwitterでは,実際にスポーツを観戦したりTV番組を視聴したりしながらリアルタイムに書き込む"実況書き込み"が増加している.本報告では,実際に観戦・視聴していないユーザの書き込みなど,他の様々な書き込みの中からこれを検出する手法を提案する.実験ではTV番組において「番組によらない情報」と「番組固有の情報」に注目して単語の出現頻度を学習して実況書き込みの検出を行った.
著者
西村 仁志 田坂 和之 川西 康友 村瀬 洋
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.73, no.5, pp.1004-1012, 2019 (Released:2019-08-26)
参考文献数
23

カメラ映像中の物体追跡では,物体の変形・遮蔽・回転等,様々な見えの変化が起こる状況でも高精度に追跡し続けることが求められる.本論文では,識別能力の高い相関フィルタと見えの変化に頑健な時系列フィルタを組み合わせた物体追跡手法を提案する.両フィルタを同時利用するために,相関フィルタによって得られた応答マップをパーティクルフィルタの観測モデルとして使用する.相関フィルタは,追跡している矩形領域をもとにパラメータを更新する.そのため,見えの変化が起こった際,追跡している矩形領域が追跡対象からずれ,誤った矩形領域を用いてパラメータを更新してしまう.提案手法では,追跡信頼度の低下によって見えの変化を検知した場合は複数の相関フィルタで追跡を行い,パーティクルフィルタの枠組みを用いて確率的に相関フィルタの更新を行う.これにより,誤った矩形領域を用いた相関フィルタの更新を低減する.実験では,追跡のAUCスコアについて,ベースライン手法が38.38%であったのに対し,提案手法では40.64%に向上し,提案手法の有効性が確認された.
著者
村瀬 洋 Vinod V.V.
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.9, pp.2035-2042, 1998-09
被引用文献数
116

本論文では, 画像中に興味ある物体が含まれているかどうか, その位置はどこかを高速に探索するアクティブ探索法について述べる.位置と大きさが不明な物体を画像中から精度良く検出するには, 従来は, 入力画像中の局所領域に着目し, その位置と大きさを変化させながら, 局所領域と参照画像との膨大な回数の照合を行う必要があり, 高速な物体検出は困難であった.本手法では, 物体の形状変形などに安定な色ヒストグラムを特徴として利用し, ヒストグラムの代数的な性質を利用することにより, 特徴照合の際に, 入力画像中のある位置の類似値からその近傍の類似値の上限値を計算する.上限値が探索値より小さければ, その領域での探索が省略できるため, 照合回数を極端に低減できる.本手法により, 総当り法に比較して, 近似を使うことなく, 計算時間を10倍から1000倍程度向上できることを実証した.物体の追跡, 検索, 計数などへの応用例についても述べる.
著者
武田 一馬 川西 康友 平山 高嗣 出口 大輔 井手 一郎 村瀬 洋 柏野 邦夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J106-A, no.3, pp.58-69, 2023-03-01

本研究の目的は,多数の人物の視行動を分析することで,観衆が注目している複数の注目対象の位置の推定と,それらが注目されている度合(被注目度)を定量化することである.被注目度を推定する典型的な方法として,観衆の視線を推定し,その視線と物体の位置を対応付けることで,被注目度を推定することが考えられる.その場合,機器を設置するコストや手間をふまえると,観衆全体を一度に撮影した映像から視線を推定することが望ましい.しかし,このようにして撮影した映像から切り出した顔画像の解像度は観客ごとに撮影した場合と比べて小さく,視線推定精度は低い.そこで本論文では,低解像度でも比較的推定しやすい顔向きの時系列データを入力とし,これらを時空間的に統合することで,観衆が複数の注目対象を注視する状況下で注目対象の位置と被注目度を同時に推定する手法を提案する.提案手法の有効性を確認するため,アイドルのライブ公演を模したデータセットを構築し,注目対象の位置及び被注目度の推定精度を評価した.実験結果から,提案手法により比較手法と比べて被注目度の推定精度が向上することを確認した.
著者
柏野 邦夫 スミス ガビン 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1365-1373, 1999-09-25
参考文献数
12
被引用文献数
70

放送など長時間の音響信号中から,特定のテーマ曲やCMなど,目的音響信号の有無及び時刻を高速に探索する方法を提案する.従来の,スペクトルや波形のずらし照合に基づく探索では,長時間の音響信号を探索対象とした場合,計算量が膨大となるという問題があった.これに対し本論文で提案する方法では,スペクトル特徴のヒストグラムに基づいて探索を行うことにより,大幅に計算時間を短縮することができる.例えば,ワークステーションを用いた実験では,音響信号からあらかじめスペクトル特徴を抽出しておいた場合,6時間の音響信号から目的音響信号(15秒間)を所要約2.3秒で正しく探索できることがわかった.また,白色ガウス雑音の重畳に対しては,SN比20dBまで頑健であることがわかった.
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.82, pp.67-72, 2001-08-04
被引用文献数
2

本稿では、音や映像のメディア探索のための曖昧文字列照合法を提案し その類似音楽検索への適用を検討する. ここで類似音楽検索とは多重奏音楽の音響信号を検索キーとして 長時間の音楽から検索キーに類似する部分を探索することである. この探索においては 信号間の類似度と信号の伸縮を考慮しなければならないことと 探索に時間がかかることが問題である. そこで 符号間の類似度を表現する類似度行列を導入し これに基づき符号系列化された信号間で 伸縮を考慮した探索を 類似度行列のスパース性により高速に行う曖昧文字列照合法を提案し この類似音楽検索に適用した. 30曲の類似音楽サンプル用いた予備実験では 曖昧文字列照合法により 従来のDPマッチングを用いたずらし照合法と比べ 約4倍高速な探索が行えた.We propose a Similarity-Based String Matching method for media information retrievaland its application to similar-music retrieval.The media information retrieval is here defined as detecting all the segments that are similar to a specified audio or video segments on a long audio or video stream. In such a task, we must consider similarities between features, deal with temporal stretching or shrinking, and also realize quick searching. Thus, the proposed method introduces a similarity matrix with a similarity enhancement technique and the DP matching method with a newly developed acceleration technique. Experiments using 30 similar-music pieces show that the proposed method can retrieve similar music fragments approximately four times faster than the conventional DP matching method, maintaining the same accuracy.
著者
村瀬 洋 シュリー ナイヤー
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.11, pp.2179-2187, 1994-11-25
参考文献数
18
被引用文献数
148

2次元画像から3次元物体を識別し,その物体の向きを検出する技術は,工業部品の分類など実用的な価値は高い.従来の代表的な手法としては,画像からエッジや表面形状などの3次元構造に着目する方法があるが,この枠組みでは3次元構造の抽出自体が困難であり,任意形状の物体に対して高い精度は得られていない.本論文では,2次元照合により3次元物体を認識する手法について述べる.2次元照合による手法は,3次元特徴の抽出が不要である等の特長はあるが,見る方向や光源の位置により複雑に変化する2次元画像をあらかじめ学習しておくことが記憶容量,計算量の点で困難であると考えられ,従来試みられていなかった.本手法では画像符号化を基本としたパラメトリック固有空間法の提案により,少ない記憶容量で3次元物体を2次元画像の集合体として学習することができるようになった.その結果,2次元画像例から物体を容易に学習すること,および困難な特徴抽出なしで3次元物体の認識とポーズ推定をすることが可能となった.本論文では,手法の提案と共に他の2次元照合的な手法との比較実験結果についても述べる.
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.11, pp.1657-1667, 2003-11-01
被引用文献数
1

本論文では,多重奏音響信号をクエリーとして多重奏音響信号から類似する音楽を探索する類似音楽探索法とその高速化手法を提案する.本類似音楽探索においては多重奏音響の類似性に基づいた探索を高速に行う必要がある.そこで,まず,多重奏において同時に発生する複数の音の有無に着目した2値多重音響特徴ベクトルを提案する.本特徴は多重奏音響信号の類似性に基づいた高速探索に適している.そして更に,本特徴を用いた探索における高速化手法を導入する.本手法は類似度行列のスパース化により探索空間を制限し,より高速な探索を行う.216曲の実験用音楽データベースを用いた探索実験では,例えば,楽曲単位の探索において,クエリーの長さが平均19秒のとき,スペクトル特徴を用いた場合に62.5%であった精度が,提案の2値多重音響特徴ベクトルを用いることにより89.3%にまで向上した.また,本高速化手法においては,精度をほとんど損なわずに,DP照合を用いたずらし照合法に比べ約1.6倍から18倍の高速化を達成した.
著者
大塚 和弘 竹前 嘉修 大和 淳司 村瀬 洋
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.7, pp.2317-2334, 2006-07-15

複数人物による対面会話を対象とし,会話参加者の視線パターン,頭部方向,および,発話の有無に基づき会話の構造の推論を行うための確率的枠組みを 提案する.本研究では,まず,会話の構造として,話し手,受け手,傍参与者と 呼ばれる参与役割と会話参加者との組合せに着目する.次に,会話中の各人物の 行動は,会話の構造によって規定されるという仮説を立て,マルコフ 切替えモデルと呼ばれる一種の動的ベイジアンネットを用いた会話 モデルを提案する.このモデルは,会話レジームと呼ばれる会話の構造に対応 した上位プロセスの状態が,マルコフ過程に従い時間変化しつつ,その会話 レジームの状態に依存して,視線パターン,および,発話が確率的に生成され,さらに,各人の視線方向に依存して頭部方向が観測されるという 階層的な構造を持つ.このモデルにおいて,会話レジームは,会話中に頻出 する視線パターンの特徴的な構造に基づいて仮説的に設定される.また,ギブスサンプリングと呼ばれる一種のマルコフ連鎖モンテカルロ法を用いて,観測された頭部方向と発話の有無の時系列データより,会話レジーム,視線パターン,および,モデルパラメータのベイズ推定を行う方法を提案する.最後に,4人会話を対象とした実験により,視線方向と会話レジームの推定精度を評価し,提案した枠組みの有効性を確認する.
著者
長内 宏之 村瀬 洋介 中島 義仁 浅野 博 味岡 正純 酒井 和好 鈴木 文男
出版者
公益財団法人 日本心臓財団
雑誌
心臓 (ISSN:05864488)
巻号頁・発行日
vol.45, no.SUPPL.3, pp.S3_92-S3_97, 2013 (Released:2015-01-09)
参考文献数
4

背景 : WPW症候群の副伝導路 (AP) に対するアブレーション時に, いったん消失したAP伝導が再開するという現象が時として見られるが, 多くの場合APの不完全焼灼に起因する「単純再発」と考えられる. 一般に, アブレーションによるΔ波の消失はAPの離断を意味するものと考えられるが, ほかの可能性として, 例えば, 焼灼によってAPの不応期が延長しその値が患者の洞周期長よりも長くなった場合, 洞インパルスはAPを伝導することが不可能となり (機能的ブロック) , Δ波は消失し得るであろう. しかしながらこれまで, そのような状況は想定されてこなかったと思われる.  症例 : A型WPW症候群の患者 (31歳, 男性) に対しアブレーションを施行した. CS電極記録にて順伝導・逆伝導ともに最早期部位は僧帽弁輪側壁部であった. 経中隔弁上アプローチにより, 洞調律下で心室最早興奮部位にて通電を行い, 14秒後にAPの伝導ブロックをきたした. 60秒間の通電の後も伝導ブロックが維持され器質的ブロックと考えられたが, 右室のカテーテル刺激によると思われる心室性期外収縮を契機にΔ波が再出現した. 出現したΔ波が持続したため, 初回の通電部位に近接する前壁側部位にて追加通電を行ったところAP伝導は消失した. その後, Δ波の再発は見られなかった.  総括 : 高周波通電によりΔ波が消失したWPW症候群の 1例において, 心室性期外収縮を契機にΔ波が再出現した. Δ波再出現の機序として「房室結節を順伝導した洞インパルスが逆行性にAP内へ進入し, その逆行性不顕伝導の効果によりAPの順伝導が機能的にブロックされていた (linking現象の持続による機能的ブロック) . この状況下にて, 心室性期外収縮による“peeling-back効果”によりAPの不応期が左方へ移動し (不応期の短縮と同等) , AP順伝導が可能となってΔ波が出現した」という説明が可能であると考えられた.
著者
澤木 美奈子 村瀬 洋 萩田 紀博 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1997, 1997-08-13

校正や添削の記号が記入された文書や、線や記号が重なり合う譜面など、複数の情報が重畳した文書が多い。 これらの認識を行う場合、従来はある情報に着目し、他の情報を雑音として削除した後に認識処理がなされていた。しかし、多くの場合、着目した情報以外を各情報に関する知識なしに総て削除することは困難であり、高い認識率が得られなかった。 ここでは、先に提案した補完類似度を用いて、複数の情報ごとに照合を行うことにより、正しく認識できることを示す。補完類似度は、ノイズにロバストであるという性質があるため、複数の情報が重畳していても、着目した対象以外を削除せずにそれらをノイズとみなすことにより、着目対象を正しく認識することができる。そのため、複数の情報を独立に扱え、複数の情報間での影響に関する知識を持つ必要がない。 本稿では、例として、文字と記号が重畳している尺八譜の認識を対象として取り上げる。
著者
澤木 美奈子 村瀬 洋 萩田 紀博 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.10, pp.2480-2482, 1998-10-25

文字や記号などの複数の情報が重畳して記述されている尺八譜を認識する手法について述べる.補完類似度を用いることにより, 複数の情報を独立に扱うことが可能となり, 高い認識率が得られることを示す.
著者
黒住 隆行 柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1817-1825, 2001-08-01
参考文献数
18
被引用文献数
10

既知の音や映像(目的信号)が長時間の音や映像(蓄積信号)のどの時点にあるか探索する問題(時系列探索)において,高速かつ高精度に探索する手法を提案する.時系列探索における問題点は,音や映像の特徴にビデオのダビングや各種圧縮方式などによるひずみが発生することである.そのようなひずみが激しく起こると,探索精度が低下する.本論文では,そのようなひずみを吸収するための手法として,確率ディザボーティングを提案する.これは,ひずみの確率分布を学習により求め,その確率分布をヒストグラム上に表現するものである.ビデオのダビングや圧縮が起こった映像を探索する実験では,いずれのひずみにおいても探索精度の改善が見られた.例えば,ダビングを4回行った1時間の蓄積信号から5秒の目的信号を探索する場合では,従来法より探索精度が4.5%改善し,本手法の有効性が確認された.本手法により,様々なひずみに対して頑健なマルチメディア探索が可能になると考えられる.
著者
前田 英作 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.4, pp.600-612, 1999-04-25
被引用文献数
38

新しいパターン識別手法, カーネル非線形部分空間法(Kernel based Nonlinear Subspace method;KNS法)を提案する. 本手法はカーネル関数によって定義された非線形変換を利用して高次元非線形空間上での部分空間法を実現したものである. 近年研究が盛んなSupport Vector Machineはカーネル関数を利用した非線形識別手法であり高い識別性能を有するが, パターン数, クラス数の増加に伴い学習に要する計算量が爆発的に増えるという問題がある. 一方, 従来の部分空間法は多クラスの識別に有効でかつ高速な識別手法であるが, パターンの分布が非線形性をもつ場合やクラス数に比較して特徴空間の次元が小さい場合に十分な識別性能が得られない. 提案手法は, 両者の利点を組み合わせることにより, 互いの欠点を補完し高い識別性能を有する多クラスの非線形識別を少ない計算量で実現する. 本論文では, 非線形部分空間法がカーネル関数で定義される非線形変換を用いて定式化可能なことを示し, 非線形分布及び多クラス分布に対する識別性能, パラメータ変動に対する識別性能の安定性, 学習及び識別に要する計算コストなどの観点から提案手法を評価し, 従来手法に比べて優れていることを検証した.
著者
柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.540, pp.21-26, 1997-02-21
被引用文献数
3

同時に複数の認識対象が混在する音の認識では,音源同定処理が必要である.本稿では,音楽の生演奏など,実環境における音の多様性や変動にも対処できる音源分離同定を行うことを目的として,適応型テンプレートを用いた音源同定処理を提案する.さらに,この処理を応用して,同時に複数の音を認識対象とするシステムの代表例であるアンサンブル演奏の認識システムを構築する.構築したシステムに対し,自然楽器音の単音によるベンチマークテスト,およびアンサンブルの生演奏を用いた音楽認識テストを行った結果,単純なマッチトフィルタによる音源同定処理に比べ,提案手法が有効であることが確かめられた.
著者
小笠原 崇 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.55-60, 2007-03-09

近年、大量に蓄積された映像データを効率的・効果的に利用するための技術が求められている。ニュース映像アーカイブにおいて、閲覧・検索のキーとなる重要な情報の一つとして映像中の登場人物がある。登場人物をキーとした映像の閲覧や検索を支援する技術は、従来から研究がなされているが、それらはもっぱら「名前」によってのみ人物を区別し、複数の呼称を持つ人物は、その呼称ごとに別々の人物として扱われてきた。本研究では、この問題に対処すべく、複数の呼称を持つ登場人物の同定(いわゆる"名寄せ")を行う手法の開発を行っている。名寄せは、言語処理や意味解析の高度化により、ある程度は実現できるが、「東国原知事」に対して「そのまんま東」のような通称を名寄せする場合など、言語処理での解決が困難な場面は多々ある。そこで、本手法では各呼称に対応付く人物の顔を利用することで、言語的な変化に影響されない枠組みでの名寄せを試みた。本報告では、5年半に渡り蓄積されたニュース映像アーカイブに対し本手法を適用した。結果から、本手法の名寄せ効果を確認した。
著者
清水 政行 川西 康友 出口 大輔 井手 一郎 村瀬 洋
出版者
公益社団法人 精密工学会
雑誌
精密工学会誌 (ISSN:09120289)
巻号頁・発行日
vol.87, no.5, pp.447-454, 2021-05-05 (Released:2021-05-05)
参考文献数
32

Estimation of translation between consecutive frames, i.e., odometry, plays an important role in autonomous navigation. This paper presents an odometry estimation method using sparse LiDAR points and image feature points. In case of sparse LiDAR measurements, it is difficult to accurately estimate depth at image feature points. Image feature points with low-accuracy depth cause misconvergence in odometry optimization. To improve the robustness to the misconvergence, a new method with a Gaussian process that estimates not only the depth at image feature points but also the variance is proposed. By using this variance, it estimates the residual of image features in the world coordinate with depth, or in the image coordinate without depth. This allows more accurate and robust estimation than conventional methods in case of sparse LiDAR points. In an experiment with simulated sparse LiDAR points from the KITTI dataset, the proposed method is confirmed to estimate the odometry more accurately than conventional methods.
著者
加藤 大貴 平山 高嗣 道満 恵介 井手 一郎 川西 康友 出口 大輔 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.5, pp.D-KC7_1-10, 2021-09-01 (Released:2021-09-01)
参考文献数
18

The Japanese language is known to have a rich vocabulary of mimetic words, which have the property of sound symbolism; Phonemes that compose the mimetic words are strongly related to the impression of various phenomena. Especially, human gait is one of the most commonly represented phenomena by mimetic words expressing its visually dynamic state. Sound symbolism is useful for modeling the relation between gaits and mimetic words intuitively, but there has been no study on their intuitive generation. Most previous gait generation methods set specific class labels such as “elderly” but have not considered the intuitiveness of the generation model. Thus, in this paper, we propose a framework to generate gaits from a mimetic word based on sound symbolism. This framework enables us to generate gaits from one or more mimetic words. It leads to the construction of a generation model represented in a continuous feature space, which is similar to human intuition. Concretely, we train an encoder-decoder model conditioned by a “phonetic vector”, a quantitive representation of mimetic words, with an adaptive instance normalization module inspired by style transfer. The phonetic vector is a dense description of the intuitive impression of a corresponding gait and is calculated from many mimetic words in the HOYO dataset, which includes gait motion data and corresponding mimetic word annotations. Through experiments, we confirmed the effectiveness of the proposed framework.