著者
南里 卓也 大津展之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピュータビジョンとイメージメディア(CVIM) (ISSN:18827810)
巻号頁・発行日
vol.46, no.15, pp.43-50, 2005-10-15
被引用文献数
48 23

セキュリティ分野における映像監視や老人介護のモニタリングシステムなどにおいて,異常動作の検出は非常に重要な課題である.そこで,本論文では,固定カメラによる複数人動画像からの異常動作検出のための教師なし手法を提案する.本手法では,画面内で頻繁に行われる動作を通常動作とし,異常動作をその通常動作の特徴分布から逸脱するものとして定義する.動作特徴として立体高次局所自己相関特徴を用いており,この特徴の加法性の性質と固有空間法の線形性がうまく組み合わさることによって,画面内に複数人いる場合でも,個々の人物の切り出しやトラッキングをすることなく容易に学習および検出が可能となる.しかも対象に関する先見知識もいっさい必要としない.実験では,複数人の歩行者の中での転ぶ動作を異常動作として検出し,手法の有効性を確認した.The detection of anomaly (abnormal/unusual) movements is an important problem in video surveillance applications. We propose an unsupervised method for anomaly movement detection in scenes containing multiple persons. Our method uses cubic higher-order local auto-correlation (CHLAC) to extract movement features. We show that the additive property of CHLAC in combination with a linear eigenspace method is well suited to simplify the learning of usual movements and to detect anomaly movements even in scenes containing multiple persons. One particular advantage of this method is that it does not necessitate the object segmentation and tracking, and also any prior knowledge about objects. Some experimental results are shown to exhibit the validity of the method.
著者
浜中 雅俊 後藤 真孝 麻生 英樹 大津展之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.100, pp.71-78, 2002-10-25
被引用文献数
5

本稿では、実在する人間の演奏者固有のフレーズを模倣するためには、ジャムセッションの演奏記録から、フレーズを再利用可能な形で切り出し、フレーズデータベース上に蓄積する必要がある.本研究では、自動でフレーズデータベースを作成するための手法として、(1)確率モデルに基づいた発音時刻のクォンタイズとそのモデルパラメータの教師なし推定法、(2)ボロノイ線図を用いたグルーピング手法によるフレーズ分割、(3)局所自己相関関数を用いたフレーズからの特徴抽出法とフレーズの空間配置法、を提案する.This paper describes a jam session system that enables a human player to interplay with virtual players, each of which imitates musical phrases of a human player. In order to imitate musical phrases of a human player, it is necessary to build a database of phrases extracted from session recording. We propose the following three methods for creating a database automatically:(1) a probabilistic-model-based quantization method for estimating the positions of onset times in a score and an unsupervised estimating method for the model parameters, (2) a phrase dividing method using the Voronoi diagram, and (3) a method of extracting the phrase characteristics by using autocorrelations and a method of locating phrases in a space.
著者
森俊二 大津展之
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1977, no.34(1977-CVIM-015), pp.1-12, 1977-11-22

対象とするパターンの持つ情報がその形にあり、濃度の微妙な変化にはないような比較的単純な場合には、画面全体をまず二値化することが、それに続く処理の簡略化ばかりでなく、対象を切り出す又は強調するという意味においても、非常に重要である。実際、文字読取装置では、二値化が必ずといってよいほど行なわれている。しかし、この問題は最っとも良く利用している文字認識技術の分野では、Bartzの論文以外ほとんど正面から取り上げて議論されていない。一方画像のほうでは、この問題は比較的良く取り上げられて、今まで種々の方法が発表されてきている。多分この様な状況は、文字の場合には、濃淡がはっきりしている対象を選べる事と、第一義的に認識アルゴリズムに研究の興味があるということ、それに実用装置を作る立場からすれば二値化の前処理はできるだけ単純にすませる必要のあった事が原因になっていると思われる。勿論上述の事は一般的傾向を示すもので、郵便番号読取機などは例外である。一方画像のほうは自然に与えられるものが多く、しかも、まず認識の第一ステップとして対象を切り出すということが重要課題となるので、二値化問題は技術的にも学問的にも取り上げられてきたと思われる。しかし文字認識技術の分野でも、認識アルゴリズムがかなりの水準に達してきて、それと共に必然的にかなり自由な対象を処理する事が要求されるようになった。また使用用紙にしても必ずしもOCR用紙でなく上質紙の使用がユーザーから要求されるようになってきた。この様な背景から、一番最初に問題になった二値化の問題に回帰する必要に迫られたのである。しかし再びこの問題に帰って見ると、それは認識の本質的問題と深いかかわりあいを持ち困難な問題である事があらためて認識させられる。以下、文字、画像データ(線図形)を対象として、二値化問題を認識問題として見直し、今まで開発された手法を含めて、二値化手法の総括的な検討を試みる。