著者
矢口 勇一 大島 万里恵 河合 天士 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学 (ISSN:09135685)
巻号頁・発行日
vol.109, no.63, pp.59-64, 2009-05-21

本論文では,Web中にあるからの感性情報の検索を行うために,Web動画中の音声検索システムを用いての類似性を基に感性検索をする方法を提案し,その予備実験を報告する.Web上のビデオデータは極めて多種多様であり,これらの感性的意味を単一の記号によって表現することか不可能に近いといえる.このような時系列データを対象にして,感性語に対応するビデオデータの区間を検索することは,かなり一般化された手法を用いる必要がある.本論文では,フレームワイズな音素識別に基づく音声検索手法をWeb上で実装したAiZoomというシステムを用い,検索したクエリと類似する音声区間を含むビデオデータの部分を抽出し,その類似区間の感性を分類した感性ヒストグラムを用いて,その動画の感性特徴を得る.また,この感性特徴を得た区間のオプティカルフローを調べて,個々の感性特徴に対応する画像特徴が得られるかを検証する.
著者
井関 健太 矢口 勇一 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.108, no.328, pp.101-108, 2008-11-20

本報告は,任意の対画像のピクセル最適対応を与える2次元連続DPを用い,少ない枚数の画像で精度のよい3次元形状が復元できることを示す.従来法が対象物体から連続的に観測した面像列における特徴点の対応系列を利用するのに対して,提案手法は画像集合の1枚の画像と任意の他の画像とのすべてのピクセル対応を利用する.ピクセル対応点が稠密に利用できるため,因子分解法によって3次元形状を復元する際,少数枚の画像から精密な形状復元ができる.ピクセル対応関係からメッシュ構造が得られる事を利用し,ドロネー三角網を定義する事なく密なテクスチャマッピングを施すことができる.これらのことを実験で示すとともに,従来法の典型であるKLT,SIFT+因子分解法を同一画像集合に適用し,比較実験も行った.これらの実験で提案手法が従来法より精密な3次元形状復元を行うことが分かった.
著者
矢口 勇一 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.69, pp.135-140, 2005-07-16

本稿の目的は,「フレームワイズな音素識別ラベルを用いた音声検索」の方式を歌声データ検索に適用し,その有用性を調べることである.すなわち,フレームワイズに音素ラベル化された歌声データを検索対照データとし,クエリーとしての歌声データを検索対象データと同様に処理した後,クエリー列を用いてデータベースから連続DPによってスポッティング認識することで類似した部分区間の検索を行い,抽出された区間を含む楽曲を検索するものである.楽曲データベース全体から歌声クエリーを用いた楽曲検索率は,4小節分のクエリーで78\%であった.また、音声クエリーとの検索率の違いも本稿では述べる.Both song wave data and a query song wave data are transformed into phoneme sequences by frame-wize labeling of each frame feature. Applying a spotting algorithm called Continuous Dynamic Programming to these phoneme sequences, we can detect a set of similar parts in the song database each of which is similar to a query song wave. Song retrieval rate hits 78\ in 4 clauses from whole databases. Additionaly, difference of each query from song wave data and speech wave data remarked in this paper.
著者
松崎隆 鈴木俊光 高橋和晃 矢口勇一 岡隆一
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1717-1718, 2011-07-20

本論文では自由視点テレビのOcclusion問題を解決するための手法を提案する. 以前に高橋らが提案した自由視点テレビは3 台の未校正カメラによって撮影された時系列画像に対して, 各フレーム毎に2 次元連続DP(2DCDP) を用いたピクセル毎の物体の運動計測を行い, 因子分解法により被写体の3 次元モデルを復元するというものであるが, 3次元モデル復元の一般的な課題であるOcclusion問題が解決されていない. 本論文ではこのシステムのカメラ台数を6台にし, 2つの3Dモデルを復元し, それを合成することでのOcclusion問題の改善手法を提案する.
著者
矢口 勇一 大島 万里恵 河合 天士 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.64, pp.59-64, 2009-05-21
被引用文献数
1

本論文では,Web中にあるからの感性情報の検索を行うために,Web動画中の音声検索システムを用いての類似性を基に感性検索をする方法を提案し,その予備実験を報告する.Web上のビデオデータは極めて多種多様であり,これらの感性的意味を単一の記号によって表現することか不可能に近いといえる.このような時系列データを対象にして,感性語に対応するビデオデータの区間を検索することは,かなり一般化された手法を用いる必要がある.本論文では,フレームワイズな音素識別に基づく音声検索手法をWeb上で実装したAiZoomというシステムを用い,検索したクエリと類似する音声区間を含むビデオデータの部分を抽出し,その類似区間の感性を分類した感性ヒストグラムを用いて,その動画の感性特徴を得る.また,この感性特徴を得た区間のオプティカルフローを調べて,個々の感性特徴に対応する画像特徴が得られるかを検証する.
著者
井関 健太 矢口 勇一 大田 和寛 千葉 将人 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.363, pp.105-110, 2008-12-11

2次元連続DPアルゴリズムと因子分解法に基づく画像からの3次元形状を効率的に復元するシステムを実現した.2次元連続DPでは画像間の全ピクセルに対する非線形対応のマッチングが可能である.そのため,因子分解法において使用される計測行列を,画像集合の1枚と任意の他の画像とのすべてのピクセル対応から生成する事で,特別な計測機器やカメラパラメータを必要とせず,少数枚数の画像のみから3次元モデルを生成する事が可能である.一方,2DCDPによる計算コストがO(N^4)となり,計算速度とメモリサイズに関する問題がある.本報告ではこれらの問題に対処するために,2DCDP計算の並列化に基づく計算機環境を構築した.また,野外の大きな建築物である城郭を対象にし,効率的に形状復元を行うシステム実装した.大規模画像への3次元形状復元には,部分3次元形状のモザイキングにより実現する.今回構築したシステムが良好に動作する事を実験により示した.