著者
Laga Hamid Masayuki Nakajima
出版者
The Society for Art and Science
雑誌
芸術科学会論文誌 (ISSN:13472267)
巻号頁・発行日
vol.7, no.4, pp.124-131, 2008 (Released:2009-01-14)
参考文献数
23
被引用文献数
8 11

We introduce a new framework for the automatic selection of the best views of 3D models based on the assumption that models belonging to the same class of shapes share the same salient features. The main issue is learning these features. We propose an algorithm for computing these features and their corresponding saliency value. At the learning stage, a large set of features are computed from every model and a boosting algorithm is applied to learn the classification function in the feature space. AdaBoost learns a classifier that relies on a small subset of the features with the mean of weak classifiers, and provides an efficient way for feature selection and combination. Moreover it assigns weights to the selected features which we interpret as a measure of the feature saliency within the class. Our experiments using the LightField (LFD) descriptors and the Princeton Shape Benchmark show the suitability of the approach to 3D shape classification and best-view selection for online visual browsing of 3D data collections.
著者
尼岡 利崇 Laga Hamid 齋藤 豪 中嶋 正之
出版者
芸術科学会
雑誌
芸術科学会論文誌
巻号頁・発行日
vol.8, no.4, pp.151-159, 2009

3次元形状測定により観客の身体形状、動作を実時間で測定しインタラクティブアートのコンテンツとするCollective Bodyを提案する。本作品は、観客の身体形状から生成した3次元モデルに観客の身体動作によって実時間で特殊視覚効果を与える作品である。本作品では、グラフィックスと特殊視覚効果をそれぞれ2種類ずつ実装した。3次元モデルは、パーティクルの集合体で表現し、特殊視覚効果は生命活動をモチーフとしパーティクルそれぞれに運動方程式を与え独自に挙動させることで表現した。ユーザーは、自分自身の身体形状、動作から生成された3次元モデルを自由視点で鑑賞することにより、本作品を通し新しいインタラクティブ体験が出来ると共に新しい視点で自身の身体を捉えることが可能となる。
著者
LAGA HAMID
出版者
東京工業大学
雑誌
若手研究(B)
巻号頁・発行日
2009

本研究は非剛体形状の理論と時系列的に変化をする表面(Time-varying surface)の3次元モデルの再構築手法に注目する。自然物は複雑な形態を持っている上複雑な変形を受けるからリアルタイム三次元再構成が混乱である。平成21年度には3次元形状データ取得システムを開発し、スキャンデータから3次元モデルの検索手法と非剛体スキャンデータ間のレシズトレーションフレームワークも開発しました。このフレームワークは三次元データ検索に基づいて高レベル知識を再構成プロセスに取り込む。その結果は、カメラの数を最小限度にすることが出来、静止することが出来ない物も3次元取得ことが出来るようになった。平成21年度にも三次元形状データベースと検索ツールを開発しました。あと、次の研究ステップに使用するためにステレオと陰影からの形状の復元と構造化照明に基づいた三次元再構成システムを開発しました。
著者
SAPAICO Luis Ricardo LAGA Hamid NAKAJIMA Masayuki
出版者
一般社団法人 電子情報通信学会
雑誌
IEICE transactions on information and systems (ISSN:09168532)
巻号頁・発行日
vol.94, no.8, pp.1671-1682, 2011-08-01
参考文献数
26
被引用文献数
1

We propose a system that, using video information, segments the mouth region from a face image and then detects the protrusion of the tongue from inside the oral cavity. Initially, under the assumption that the mouth is closed, we detect both mouth corners. We use a set of specifically oriented Gabor filters for enhancing horizontal features corresponding to the shadow existing between the upper and lower lips. After applying the Hough line detector, the extremes of the line that was found are regarded as the mouth corners. Detection rate for mouth corner localization is 85.33%. These points are then input to a mouth appearance model which fits a mouth contour to the image. By segmenting its bounding box we obtain a mouth template. Next, considering the symmetric nature of the mouth, we divide the template into right and left halves. Thus, our system makes use of three templates. We track the mouth in the following frames using normalized correlation for mouth template matching. Changes happening in the mouth region are directly described by the correlation value, i.e., the appearance of the tongue in the surface of the mouth will cause a decrease in the correlation coefficient through time. These coefficients are used for detecting the tongue protrusion. The right and left tongue protrusion positions will be detected by analyzing similarity changes between the right and left half-mouth templates and the currently tracked ones. Detection rates under the default parameters of our system are 90.20% for the tongue protrusion regardless of the position, and 84.78% for the right and left tongue protrusion positions. Our results demonstrate the feasibility of real-time tongue protrusion detection in vision-based systems and motivates further investigating the usage of this new modality in human-computer communication.