著者
栗田 多喜夫 加藤俊一 福田 郁美 坂倉 あゆみ
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.33, no.11, pp.1373-1383, 1992-11-15
参考文献数
28
被引用文献数
180

利用者の主観を反映させた印象語からの絵画データベースの検索法を提案する。「ロマンチックで暖かい」というような視覚的印象は 利用者の好み 文化的背景などの違いにより個人ごとに異なっていると考えられるので そうした要求からの検索を実現するためにはシステムはその利用者にとって「ロマンチックで暖かい」とはどういうことなのか評価できなければならない.このとき データベースに蓄えられるすべての絵画に対して 利用者ごとの主観的属性をあらかじめ登録することは困難である.本積では 各利用者に学習用の絵画に対して印象語を付けてもらい その結果から正準相関分析により印象語と画像特徴との相関関係を学習し それを検索に利用する方法について述べる.各利用者の印象語と画像特徴との主観的態対応関係を学習しておくと 印象からの検索はもちろん 類似画検索や未知の絵画に対して印象語を推定することなども可能となる.印象派の絵画を対象とした画像データベースに対して 提案した手法による検索実験を行い良好な結果が得られた.
著者
新田 克己 長谷川 修 秋葉 友良 神嶌 敏弘 栗田 多喜夫 速水 悟 伊藤 克亘 石塚 満 土肥 浩 奥村 学
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2081-2087, 1997-08-25
被引用文献数
17

論争支援マルチモーダル実験システムMrBengoは, 法廷における論争をシミュレートする知識ペースシステムに, 顔認識, 表情合成, 音声認識, 音声合成, WWWブラウザなどのモジュールを結合したマルチモーダル実験システムである. このシステムは, 原告(検察官), 被告側弁護士, 裁判官という仮想的な三つのエージェントからなっている. ユーザは被告側弁護士に音声で指示を出して, 検察官と法廷論争を行い, 論争が終了すると裁判官が判決を下す. 論争の状況に応じて, エージェントの表情が変化するので, ユーザはそれを見ながら論争の戦略をたてることができる.
著者
栗田 多喜夫
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第48回, no.人工知能及び認知科学, pp.253-254, 1994-03-07

線形回帰分析において汎化能力の高いモデルを構築するためには、与えられた説明変数の集合から予測に有効な変数の部分集合を見つけ出す必要がある。ここでは、遺伝的アルゴリズムを用いて有効な変数の部分集合を探索する試みについて報告する。
著者
鈴木 浩二 松川 徹 栗田 多喜夫
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.7-12, 2009-03-06
被引用文献数
2

局所特徴を SVM により背景領域からの特徴と対象領域からの特徴に分類し利用する手法 (初期特徴選択) を提案する.初期特徴選択の有効性を検証するために,UIUC Image Database を用いて SIFT 特徴を車領域からの SIFT 特徴と背景領域からの SIFT 特徴に分類する SVM を作成し,SIFT 特徴を用いた Bag-of-Features の特徴選択に適用する実験を行った.この実験の結果,Bag-of-Features において背景領域からの SIFT 特徴を SVM で選択的に取り除くことにより,クラスタ数が少ない場合において従来手法よりも識別率を向上させることできた.We propose a local feature selection method that classifies local features into background's features and target's features using SVM. We applied this feature selection method to "bag-of-features" method in generic object recognition problem. To verify the effectiveness of the proposed method, we conducted experiments using UIUC Image data base. Experimental results showed the proposed method outperformed the conventional Bag-of-Features representation with a fewer number of clusters.
著者
鈴木 浩二 松川 徹 栗田 多喜夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.7-12, 2009-03-06
被引用文献数
5

局所特徴をSVMにより背景領域からの特徴と対象領域からの特徴に分類し利用する手法(初期特徴選択)を提案する.初期特徴選択の有効性を検証するために,UIUC Image Databaseを用いてSIFT特徴を車領域からのSIFT特徴と背景領域からのSIFT特徴に分類するSVMを作成し,SIFT特徴を用いたBag-of-Featuresの特徴選択に適用する実験を行った.この実験の結果,Bag-of-Featuresにおいて背景領域からのSIFT特徴をSVMで選択的に取り除くことにより,クラスタ数が少ない場合において従来手法よりも識別率を向上させることできた.
著者
栗田 多喜夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J73-D2, no.11, pp.1872-1878, 1990-11-25

本論文では,情報量基準を評価基準として,3層のフィードフォーワード型のニューラルネットの隠れ層のユニット数を自動的に決定する試みについて報告する.情報量基準としては,赤池のAIC(A Information Theoretical Criterion)とRissanenのMDLP(Minimum Description Length Principle)を用いた.Fisherのアヤメのデータの識別のためのネットワークーとフーリエスペクトルに基づく話者識別のためのネットワークに対する実験結果を示す.
著者
井手 秀徳 栗田 多喜夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.8, pp.1110-1119, 2018-08-01

ReLU活性化関数は,その微分が消失しないことから,最急降下法に基づくパラメータの学習が効果的に行えることが知られており,Convolutional Neural Network (CNN)でも良く利用されている.しかし,学習が進むとReLUの出力が必要以上に大きくなってしまう傾向がある.ある層のあるニューロンの活性化関数の出力が大きくなると,それ以降の層に対してバイアスとして働き,Networkに悪影響を与えることが知られている.このことから,活性化関数の出力は平均0に近づけると汎化性能が向上することがわかっている.有名なものでは,L1正則化などの重みに対する正則化やBatch Normalization,ELUなどの活性化関数が知られている.本研究では,それらの代わりにReLU活性化関数の入力に対するスパース正則化を用いる手法を提案する.活性化関数の入力に対するスパース正則化は,学習の過程でReLU活性化関数の入力を0に近づける効果をもつ.これにより,ReLU活性化関数の欠点をある程度抑制することができ,特徴表現をスパースにすることができる.
著者
松川 徹 日高 章理 栗田 多喜夫
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.12, pp.3222-3232, 2009-12-15

スポーツやお笑いなどのエンタテイメント産業では,観客の観覧内容に対する満足度を知ることがサービスの質を評価するうえで重要となる.通常は観客に対するアンケート調査などで満足度評価を行うが,そのような方法では多くの人手や費用が必要となる.そのため観客の満足度調査をビデオ映像などから自動的に行う手法の開発が求められている.本論文では顔認識技術によって観客の表情や顔の向きなどの情報を自動的に取得し,それらに基づいて観客の満足度を機械的に推定するシステムを提案する.提案システムでは観客が映っているシーンからまず観客の顔の検出と向きの推定を行い,それから表情識別器によって検出された顔を笑顔と非笑顔に分類する.次に,あるシーンから検出された顔の向きと表情の組合せの出現頻度を数えあげたヒストグラムを作成する.このヒストグラムを特徴ベクトルとした識別器を用いて各シーンの状況(観客が喜んでいるシーンかどうかなど)を判別し,"喜んでいる" または"真検に観戦している" 度合いとしての満足度の推定を行う.実際のスポーツ観戦動画を用いた実験により,提案するヒストグラム特徴でサポートベクタマシンを学習し,観客が"喜んでいる" シーンかどうか,"真剣に観戦している" シーンかどうかなどの判別およびその満足度推定を有効に行えることを確認した.In the entertainment industry which treats sports or comedy show, understanding whether their spectators have been satisfied or not is important to evaluate the quality of their services. Currently, questionnaire survey has been used to evaluate the degree of their satisfaction. But great cares of cost and time are required for questionnaire survey. So it is desired to automatically evaluate spectator's satisfaction degree from video sequences. This paper presents a system for automatically evaluation of degree of spectators' satisfaction in video sequences. The proposed system is designed by a "bag-of-visual-words" approach based on face recognitions. First, the multiview (left-profile, front, right-profile) faces are detected from each image in the given video sequence. Then the detected faces are classified into the two expressions, smile or not. The classification results of the face directions and the facial expressions are voted to each classes' histogram over the video sequence. Finally, the state of the spectators is classified by using the kernel SVM on the voted histograms. The degree of spectators' satisfaction is estimated by the classification score of "Positive Scene" or "Watching Seriously". Our approach demonstrated promising results for classifications of "Positive Scene" and "Negative Scene" or "Watching Seriously" and "Not Watching Seriously".
著者
松川 徹 日高 章理 栗田 多喜夫
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.12, pp.3222-3232, 2009-12-15

スポーツやお笑いなどのエンタテイメント産業では,観客の観覧内容に対する満足度を知ることがサービスの質を評価するうえで重要となる.通常は観客に対するアンケート調査などで満足度評価を行うが,そのような方法では多くの人手や費用が必要となる.そのため観客の満足度調査をビデオ映像などから自動的に行う手法の開発が求められている.本論文では顔認識技術によって観客の表情や顔の向きなどの情報を自動的に取得し,それらに基づいて観客の満足度を機械的に推定するシステムを提案する.提案システムでは観客が映っているシーンからまず観客の顔の検出と向きの推定を行い,それから表情識別器によって検出された顔を笑顔と非笑顔に分類する.次に,あるシーンから検出された顔の向きと表情の組合せの出現頻度を数えあげたヒストグラムを作成する.このヒストグラムを特徴ベクトルとした識別器を用いて各シーンの状況(観客が喜んでいるシーンかどうかなど)を判別し,“喜んでいる” または“真検に観戦している” 度合いとしての満足度の推定を行う.実際のスポーツ観戦動画を用いた実験により,提案するヒストグラム特徴でサポートベクタマシンを学習し,観客が“喜んでいる” シーンかどうか,“真剣に観戦している” シーンかどうかなどの判別およびその満足度推定を有効に行えることを確認した.
著者
栗田 多喜夫
雑誌
全国大会講演論文集
巻号頁・発行日
vol.48, pp.253-254, 1994-03-07

線形回帰分析において汎化能力の高いモデルを構築するためには、与えられた説明変数の集合から予測に有効な変数の部分集合を見つけ出す必要がある。ここでは、遺伝的アルゴリズムを用いて有効な変数の部分集合を探索する試みについて報告する。
著者
加来 俊彦 栗田 多喜夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理 (ISSN:09135685)
巻号頁・発行日
vol.101, no.423, pp.33-38, 2001-11-08
参考文献数
8

一般写真からの顔抽出では画像中の大部分を占める顔以外の領域での誤抽出を削減する必要がある。テンプレートマッチング等のように顔の各点において均等な重みで識別器を構成すると、頬やおでこなどの面積の広い部分は影響が大きく、目や鼻などの小領域の影響は小さくなり、誤抽出が起こる。そこで本論文では、顔の各点で"顔らしさ"を求め、顔の抽出に有効な特徴点を選択し、それらを統合して誤抽出を抑制する方法を提案する。切り出した画像の各点での"顔らしさ"は、各点の周辺領域の輝度値から線形判別分析により構成した特徴量に基づいて定義した。
著者
西田 健次 栗田 多喜夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.333-342, 2005-05-13

カーネル学習法は、非線形識別関数を効率よく構成する手法であり、カーネルトリックとも呼ばれている。サポートベクターマシンは、現在知られている多くのパターン認識手法の中でも認識性能の優れた手法であると考えられているが、カーネルトリックによって非線形識別関数を構成できるようになったことが、その性能向上に大きく貢献している。カーネル学習法とサポートベクターマシンに代表される線形識別手法を組み合わせることにより高性能な識別器を構成する事が可能になったが、未学習データに対する認識性能(汎化性能)を更に向上するためには変数選択などの手法が重要な役割を果たす。本稿では、サポートベクターマシンを中心にカーネル学習法について概説し、汎化性能向上のための変数選択手法などを紹介する。さらに、画像認識への応用例も紹介する。Kernel method, which is also called Kernel Trick, is known to be one of the best scheme to extend linear classfier systems to nonlinear classifier systems. Support vector machine (SVM) is recognized as one of the best models for two class classification among the many methods, since its performace is drastically improved by kernel trick. Although we can build a high performance classifier system with combination of kernel method and linear classification method such as SVM, feature selection is still important to obtain high performance for unlearned data. This paper reviews kernel methods centering on the SVM and introduces some feature selection methods. Some examples of applications for image understanding are also introduced.
著者
栗田 多喜夫 麻生 英樹 梅山 伸二 赤穂 昭太郎 細美 章隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.2, pp.257-266, 1996-02-25
被引用文献数
9

本論文では, 多層パーセプトロンの中間層の各ユニットに独立なノイズを加えたとき, 学習結果がどんな影響を受けるかについて考察し, ノイズを付加することによりネットワークが構造化されることを示す. 具体的には, 中間層が1層のみで, 出力層の入出力関数が線形のネットワークの中間層の各ユニットに独立なノイズを加えた場合の誤差逆伝搬学習アルゴリズムの平均的な振舞いを解析し, 中間層から出力層への結合荷重はより小さな値をとるようになり, 逆に, 入力層から出力層への結合荷重は中間層の出力が0か1に近づくようになることを示す. これは, 中間層の各ユニットにノイズを付加することにより, ネットワークが自動的に構造化されることを意味している. その結果として間接的に汎化能力の高いネットワークが構成されることが期待でき, 学習におけるノイズの役割として非常に興味深い. 更に, パターン識別問題と論理関数の学習問題に対して, ノイズを加えて学習した場合とノイズを加えないで学習した場合を比較し, ノイズを加えることによりネットワークが構造化されることを実験的に確かめた.