著者
川嶋 宏彰 西村 拓一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.197-209, 2006-05-18
参考文献数
136
被引用文献数
9

本稿では、1980年代から盛んになってきたコンピュータビジョンにおける時系列パターン認識技術について概観する。特に非線形時間伸縮パターンの認識技術をパターンマッチングによる手法とモデルに基づく手法に分けて述べる。また、応用分野として表情認識および音響情報と視覚情報の統合に関して述べる。In this paper, we will survey researches on temporal pattern recognition which has been popular in 1980s in the field of computer vision. We will focus on dynamic time warping method categorizing it into pattern matching method and model based method. Furthermore, expression recognition and fusion of sound and image are introduced.
著者
川嶋 宏彰 西川 猛司 松山 隆司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.12, pp.3715-3728, 2007-12-15
被引用文献数
2

円滑な会話を進めるうえでは,参与者間で自然な間合いの発話権受け渡し(話者交替)が行われる必要がある.従来研究では,一方の発話終了からもう一方の発話開始までの時間(発話移行区間長)がしばしば解析されてきたが,実際の対面会話においては,相手話者の視線や口元の動きなどの視覚的に観察可能な身体動作も,発話権受け渡しの「間合い」を支えていると考えられる.そこで本研究では,話者が1 人であるにもかかわらず複数の役柄間での円滑な話者交替を表現している落語に着目し,演者の頭部動作の開始と発話開始・終了の時間的構造の解析を行った.その結果,先行発話終了に対する頭部動作の開始タイミングは,二者間会話の漫才における後続話者の発話開始タイミングと類似しているという知見が得られた.これは,視覚的な刺激の制御が,話者交替において受け手が感じる冗長な間合いを補間可能であることを示唆し,実際に被験者実験によってその評価を行った.Coordination of turn-taking with natural timing is important to realize a smooth conversation among multiple speakers. The existing studies often analyze an utterance transition interval, which is the interval from the end of the previous speaker's utterance to the beginning of the succeeding speaker's utterance. However, the effect of visually observable motions (e.g., gazing and lip motions) is also important to coordinate timing of turn-taking in face-to-face interaction. In this paper, we therefore focus on Japanese traditional Rakugo performances, in which smooth conversations among multiple roles are displayed by only one performer's act based on the control of the head motion timing during switching the roles. The result of analysis shows that the dynamic structure of intervals from the end of the previous utterance to the beginning of the head motions in Rakugo performances is similar to the structure of utterance transition intervals in Manzai dialogs, which are two-speaker conversations. The result suggests that the control of visual stimuli have the capability of filling redundancies in the pauses of turn-taking. We therefore examined the effectiveness based on psychological experiments.
著者
佐竹 純二 小林 亮博 平山 高嗣 川嶋 宏彰 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.137-142, 2008-02-14
被引用文献数
7

本研究では,大型ディスプレイを用いた情報提示システムにおいて,ユーザの顔や視線の方向を推定し,ユーザの興味や反応を認識することで,コンテンツをインタラクティブに制御することを目指している.カメラ画像のみを用いた視線推定法では,視線を虹彩中心と眼球中心を結ぶ直線として求める方法が一般的であるが,目領域の解像度が低いために誤差の影響が大きかった.そこで,高解像度カメラ(UXGA 30fps)を導入し,角膜による屈折を考慮した詳細な虹彩形状モデルを用いて,より高精度に視線を推定する方法を報告する.
著者
松山 隆司 東海 彰吾 杉本 晃宏 和田 俊和 波部 斉 川嶋 宏彰
出版者
京都大学
雑誌
基盤研究(A)
巻号頁・発行日
2001

3次元ビデオ映像の能動的実時間撮影・圧縮・編集・表示法の開発を目指して、平成13年度〜15年度の3年間の研究により以下の成果を得た。(1)Myrinet高速ネットワークでPC30台を結合し、IEEE1394首振りカメラ25台を持つ能動的実時間3次元ビデオ映像撮影用PCクラスタシステムを開発した。(2)首振りカメラを準視点固定型パン・チルト・ズームカメラとしてモデル化し、高精度にキャリブレーションを行う手法を開発した。(3)3平面視体積交差法およびPCクラスタを用いた並列パイプライン処理システムを開発し、毎秒10フレームを超える処理速度で人体動作の3次元ディジタル化を実現した。(4)より高精度な3次元形状復元、高精細テクスチャマッピングの実現を目指した、人体部位の分散協調的ズームアップ撮影のための多視点カメラワークの最適化法を考案した。(5)視体積交差法で得られた3次元形状の復元精度向上のため、弾性メッシュモデルの動的変形による高精度3次元形状復元アルゴリズムを開発した。(6)対象の観察視点・視線情報を利用した高品質テクスチャマッピングアルゴリズムを考案した。(7)複数のランバーシアン参照球を用いた光環境センシシグ法(複数光源の推定法)を考案した。(8)スケルトン・キューブ(枠のみからなる立方体)を用いたセルフシャドウに基づく光環境センシング法を考案した。(9)3次元ビデオと全方位パノラマ映像を素材として使った3次元ビデオ映像のインタラクティブ編集システムを開発した。(10)正多面体展開図を用いた全方位パノラマビデオ映像の符号化法を開発しMPEG会議へ標準化提案を行った。(11)3次元ビデオ映像の圧縮法を考案しMPEG会議へ標準化提案を行った。