著者
松井 甲子雄 大西 淳児 中村 康弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.6, pp.1017-1024, 1996-06-25
被引用文献数
41

この論文では, 画像を多重解像度表現する直交ウェーブレット変換において, ひそかに署名データを画像に埋め込む一方法を提案する. その原理は, 画像の多重解像度表現における差分出力に偏りがあることに注目し, その特徴を手掛りに署名ビット系列を画像に埋め込むものである. その際, 256×256画素からなる濃淡画像でおおむね6Kバイト程度の文字情報を合成可能である. この方法は画像の著作権を表示する署名データのみならず, 画像の作者や使用条件, あるいは画像そのものの属性情報までも包含でき, 画像データベースの検索などにおいても類似画像の識別を容易にできるなどの応用が考えられる.
著者
土居 元紀 陳 謙 眞溪 歩 大城 理 佐藤 宏介 千原 國宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2203-2208, 1997-08-25
被引用文献数
37

会社やマンションなど, 不審人物の侵入を防ぎたい管理施設の入口において, より信頼性が高く利用しやすいセキュリティシステムが望まれている. そこで, 顔画像照合の結果により入口の解錠を決定する解錠制御システムを試作した. 実用的な解錠制御システム開発の観点から顔画像照合を検討し, 顔画像照合手法を, 入力画像からの顔領域の抽出, 顔領域の大きさ・傾き正規化と顔部品照合で構成した. 信頼性の高い照合実現のため, 目頭検出による精度の高い顔領域の大きさ・傾きの正規化を用いた. また, 目・鼻・口といった特徴的な顔部品を照合対象とすることにより, 眼鏡や髪型などの偽証しやすい部分を照合領域から排除している. 顔部品照合において本人のものか否かを決定するしきい値は統計的に決定した. 実際にシステムの性能について評価した結果, 本人の入室許可が92.2%, 他人の入室拒否が99.6%という照合成功率を得た.
著者
長坂 晃朗 宮武 孝文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1831-1837, 1998-08-25
被引用文献数
32

本論文では, 過去に入力された映像と同一の映像の入力をリアルタイムで検出してクラスタリングするシーン分類手法を提案する.これは, 連続して入力される映像について, その特徴を時系列圧縮して記憶し続けると同時に, それまでに入力された映像系列の中から, 最新の入力映像と一致する無制限の長さの部分映像区間をすべて見つけ出す.本手法を一般的なパソコンに実装し, 放送中のコマーシャル映像を分類する実験を行ったところ, 特徴量を1秒当り平均20バイト以下の容量で記憶しながら, 漏れなく一意に分類できることを確認した.また, 過去8時間分の映像を記憶した状態でも1フレーム入力当りの処理時間は平均10ms以下であり, 数日分の映像に対して実時間で分類ができる見通しを得た.
著者
長尾 智晴 安居院 猛 長橋 宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.557-565, 1993-03-25
被引用文献数
60

本論文では,任意の点列としてあらかじめ与えられたモデル図形に相似な図形を,ノイズを多く含む2値画像から抽出する手法について述べている.原画像中の相似図形の位置,拡大倍率,回転角度はすべて未知とする.この抽出処理は,モデル図形を原画像中の図形に重ねたときに,最もよく重なるときのモデル図形の重心のx,y座標,拡大倍率,回転角度を求める処理であり,これら四つのパラメータによる空間において,図形の重なりを評価値にしたときの最大値探索問題とみなすことができる.そこで本論文では,最適値探索手法として知られている遺伝的アルゴリズムの考え方を用いた遺伝的手法を提案している.本手法では,特に,探索空間に対する前処理,および親の個体の適応度に応じた遺伝規則の調整を考慮したアルゴリズムを提案している.そして,本手法がこのようなパターンマッチングの問題に有効に適用できることを,実験結果を用いて示している.
著者
神原 誠之 大隈 隆史 竹村 治雄 横矢 直和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1775-1783, 1999-10-25
被引用文献数
37

現実環境と仮想環境を融合する技術は拡張現実感と呼ばれ,現実環境に情報を付加することが可能であることから新たな情報提示手法の-つとして注目されている.拡張現実環境をユーザに提示するには,現実環境と仮想環境の正確な位置合せ,画像合成,及びユーザへの提示を実時間で行う必要がある.本論文では,現実環境と仮想環境の時間的な同期がとれることから,両者の位置ずれが生じないという特徴をもつ,ビジョンセンサとビデオシースルーの組合せを用いる拡張現実感のための画像合成手法を提案する.本手法では,現実環境中に配置されたマーカをHMDに取り付けた2眼のステレオカメラで撮影し,この画像から位置合せに必要なカメラパラメータを推定する.同時に,現実物体と仮想物体の正確な前後関係を表現するために,現実環境の奥行情報を実時間で取得する.その際,奥行推定を拡張現実感に特化することで計算量を削減し,実時間処理を可能にした.
著者
望月 貴裕 蓼沼 眞 藤井 真人 伊藤 崇之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1729-1739, 2005-08-01
被引用文献数
3

本論文では, 検索対象データベース(DB)に出現頻度の高いテクスチャ及び色集合(代表テクスチャ, 代表色)を用いて描画した問合せ画像による画像検索手法を提案する. 代表テクスチャは, DBの画像特徴ベクトル集合のクラスタ分析により抽出する. また, 代表色は, DBのHSVヒストグラムに基づき求める. 更に, 提案手法によるユーザインタフェースを試作し, これを用いた画像検索実験により, 利用者の検索意図を反映した良好な結果が得られることを確認した.
著者
中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.2, pp.433-457, 2000-02-25
被引用文献数
66

本論文では音声認識の最近の研究動向について述べる.まず, はじめに, 現在の機械による音声認識能力がまだ人間の能力に及ばないことを述べ, 特に音響モデルの改善が必要なことを論じる.次に実用化にとって重要な雑音等に頑健な特徴パラメータや前処理について述べる.情報理論やパターン認識の立場から認識対象と同じ環境で収集された多量の音声サンプルを用いることが有用であることを指摘する.次に音声認識の中心技術である音響モデルと言語モデルについて述べる.まず, 音響モデルの中心技術となっている隠れマルコフモデル(HMM)の原理と限界を述べ, 最近の改良研究について詳述する.言語モデルの音声認識における役割は, 発声され得ない認識候補の除外, すなわち探索空間の削減にある.言い換えればエントロピーを小さくするモデルが好ましいという観点から統計的な言語モデルの最近の研究動向を述べる.最後に, 音声認識システムを構築するのに留意すべき点について論じる.
著者
長田 礼子 尾崎 哲 青木 輝勝 安田 浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.2, pp.258-265, 2001-02-01
被引用文献数
17

本論文では, パスワードの代わりに手指の動きによる動画像を用いたリアルタイム個人認証システムを提案する.本論文で提案する手指動認証は, 秘密情報型, バイオメトリクス型の双方の特性を兼ね備えており, 従来技術と比較して正確な個人認証が可能となる特徴がある.本研究では同じ手指動パターンにも個人的な動作特徴があることに着目し, この特徴を抽出することにより個人認証を行う.また, 装置が簡単で, 自然な形での入力であるという点でもシステムは優れている.
著者
荒木 哲郎 池原 悟 塚原 信幸 小松 康則 田川 崇史 橋本 憲久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.6, pp.1516-1528, 2000-06-25
被引用文献数
10

漢字OCR, ワープロ, 音声認識装置などの入力装置を使用して計算機に入力された日本語文には, 通常, 誤字, 脱落・誤挿入文字などの誤りが含まれるため, これらの誤りを自動的に検出し訂正する技術が期待されている.本論文では, 誤字誤り, 誤挿入誤り, 及び脱落誤り(いずれも誤りは1文字以上)を対象に, m重マルコフ連鎖モデルを用いて誤りの種別を識別し, 誤り文字列を訂正する方法を提案する.また, 本手法の効果を検証するため, 2重マルコフ連鎖モデルを利用して, 漢字仮名交じり表記された新聞記事文(1, 200文)を対象に, それらが誤字, 脱落文字及び誤挿入文字を含む場合(いずれも誤りは, 擬似的に生成された1文字または2文字)について, 誤り種別及び文内の誤り位置と文字数を自動的に検出, 並びに訂正する実験を行った.その結果, オープンデータの誤字, 誤挿入, 脱落の誤りを, 単に, 誤りとして検出(これらの3種のいずれかの誤りとして検出)する精度は, それぞれ, 1文字の誤字または誤挿入誤りの場合は適合率77.2%, 再現率95.0%, 2文字の誤字または誤挿入誤りの場合は適合率79.3%, 再現率99.5%, また, 脱落誤りの場合は適合率61.3%, 再現率36.5%の精度で検出できることがわかった.更に, 誤りの種別や誤り長を含めた検出精度は, 誤字または誤挿入の1文字誤りの場合は, 検出が適合率60.1%, 再現率73.0%で行うことができ, 更に訂正は誤字の場合が適合率41.2%, 再現率50.0%, また誤挿入の場合が適合率41.9%再現率52.0%の精度で自動的にできることがわかった.これと比べて, 脱落誤りの検出と訂正は容易ではないが, 検出が適合率54.6%, 再現率32.5%, また訂正が1文字の場合には適合率29.4%, 再現率17.5%の精度で行えることがわかった.オープンデータとクローズドデータによる適合率, 再現率の差は, 標本量の増加に伴い, 新聞記事文5年分の付近で, かなり接近してくることがわかった.
著者
福井 和広 山口 修 鈴木 薫 前田 賢一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.4, pp.613-620, 1999-04-25
被引用文献数
85

顔画像認識において照明変動に対するロバスト性は不可欠な特性である. 本論文では"制約相互部分空間法"を用いた照明変動にロバストな顔画像認識法を提案する. 制約相互部分空間法は, パターン変形に対する高い吸収能力をもつ相互部分空間法の拡張で, 前処理として"制約部分空間"に射影された入力部分空間と辞書部分空間のなす最小角度を類似度と定義する. ここで制約部分空間を照明変動成分が含まれない部分空間とすれば, 最小角度, つまり類似度は照明変動に影響されないことになる. この要求を満たすために, 異なる人物の顔パターン分布を表す二つの部分空間に対してその差異を表す"差分部分空間"を導入する. これを同じ照明条件で生成した様々な人物の部分空間の組合せに対して求め, 求めた差分部分空間の集合の主成分空間を制約部分空間とする. 照明条件が大きく異なる顔画像を用いた評価実験により提案法の有効性を示す.
著者
新田 直子 馬場口 登 北橋 忠宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1838-1847, 2001-08-01
被引用文献数
24

我々は放送型スポーツ映像に対して映像・試合の構成に従い,ストーリー上重要と考えられる部分への意味的なアノテーションの自動生成を試みる.まずクローズドキャプションと呼ばれる言語ストリームから,キーワード列探索によりスポーツ映像において重要な意味をもつ実際に試合が進行している部分を抽出した上で,各部分でのプレイ・プレイを行った選手に関する情報を抽出しアノテーションを生成する.次に生成したアノテーションを付ける映像位置を決定するため,画像ストリームに対するマッチングにより同様に試合進行部分を抽出することで映像分割を行う.最後に両ストリームの時間的同期をとることによって,生成したアノテーションを映像に対して与える.本手法をスポーツ映像の例として実際のアメリカンフットボールの試合映像に適用し実,験を行った結果,再現率75%,適合率90%で映像の正確な試合進行部分に対して自動的にアノテーションを付けることが可能となった.
著者
小野田 崇
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.5, pp.776-784, 2002-05-01
被引用文献数
9

AdaBoostの有する高い汎化能力は,Support Vector Machineで導入されたmarginの概念を適用することで解明されている.しかしながら,この汎化能力の高さは,学習データ中に誤分類や非常に大きい雑音を含んだデータがない場合に限られるものである.誤分類や大きい雑音を含む場合,AdaBoostは高い汎化能力を実現できないことが実験的に示されている.また,これらの結果はmarginの改善という視点から,Schapireらの研究によって理論的な裏付けが行われている.本論文では,Schapireらの議論に基づき,AdaBoostの起こす過学習を避けるため,AdaBoostが最小化する目的関数に正則化項を導外した新たなアルゴリズムAdaBoost_<Reg>,ν-Arc,ν-Boostを提案する.
著者
住谷 正夫 安久 正紘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J73-D2, no.3, pp.478-485, 1990-03-25

心地よい自然の風を作るために,モータの回転数をパワースペクトルが1/fになる揺らぎを用いて制御する方法が提案されているが,本論文では,この1/f揺らぎ制御が人間の快適感におよぼす効果を,白色,1/f2などの各種揺らぎ制御との比較によって明らかにした.快適性の評価方法として,言語対による主観申告データを用いて主因子分析を行い,快適性を示す因子を抽出し,その因子に含まれる項目の評価を数値化し比較評価する方法を用いた.扇風機制御におけるデータ収集は,揺らぎ制御を行わない場合と,各種揺らぎデータを用いて回転数を制御する場合について行い,30名の申告データにおいて,各制御時の評価値を平均した結果により比較検討を行った.また,風と同様に人間の皮膚感覚に直接刺激を与えるものにマッサージがあり,マッサージにおいても,強さや速さの変化がある.そこで,マッサージ機についても揺らぎ制御を行い,同様の主観申告データを得た.得られたデータを解析すると,扇風機,マッサージ機のいずれにおいても,1/f揺らぎ制御時に人間が最も快く感じられるという結果を得た.今後,いろいろな場面で,1/f揺らぎ制御が機械と人間の潤滑油として,有効となりうる可能性を示唆した.
著者
山田 憲嗣 高橋 秀也 志水 英二
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J80-D2, no.11, pp.2986-2994, 1997-11-25

本論文では,短波長域における結像法として利用されている符号化開口法を可視光域に適用し,物体の位置と物体表面の3次元形状を検出する手法について述べる.本手法は物体から開口面までの距離により,投影面上に映る開口面の大きさが変化する特性を用い,開口面から物体までの距離を検出する.この距離検出を対象物体の表面の各画素に拡張することで物体表面の3次元形状を検出する.実際に,短波長域で用いる符号化開口法を可視光域で用いることができる条件を考察し,試作システムを構築して3次元物体の形状を検出した.提案する検出法は,両眼視法とは異なり,物体の反射光だけを利用した単眼視法であるので,簡単な測定システムで3次元形状検出を実現することができる.また,光だけでなく波動の性質をもつものであれば可視でも不可視でも本手法を利用し,3次元形状検出を行うことが可能である.
著者
朴 鎔燮 北岡 裕子 佐藤 嘉伸 上甲 剛 中村 仁信 田村 進一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1618-1627, 2001-08-01
参考文献数
18
被引用文献数
6

CTスキャナの高速化高解像度化により,胸部全体の3次元CT画像が取得可能になってきた.本論文では,異なる呼吸相での胸部CT画像から肋骨の運動を解析する手法を提案する.提案手法では各肋骨を肋骨の中心線に相当する曲線として表現し,肋骨運動の解剖的な知識に基づいた誤差関数により曲線の繰返しレジストレーションを行い,肋骨の回転中心軸と軸周りの回転角度を計算する.画像シミュレーションにより,中心線抽出精度,レジストレーション精度,提案した誤差関数の収束性の評価を行った.提案手法を4人の健康ボランティアのCT画像に適用することにより評価し,計測結果を論じた.本手法は,単純性と精度の面で肋骨の呼吸運動の計測に有用であることが示された.
著者
魏 回 北村 正 岩田 彰 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.4, pp.689-696, 1992-04-25
被引用文献数
4

多数のカテゴリーを分類する一つの手法として,我々は大規模ニューラルネット(CombNET-II)を提案した.これは,前段に入力ベクトルを大分類するためのベクトル量子化型ニューラルネットを配置し,後段にグループ内のデータを細分類するための階層ニューラルネットを配置した.くし型の構成をしている.本論文では,CombNET-IIを用いる大語いの音声認識手法を提案し,この方法を中国語の単語音声認識に適用し,その有用性について検討する.音声信号から2次元メルケプストラム法によって求められる特徴量をCombNET-IIの入力に用いる.2次元メルケプストラムは音声の静的特徴と動的特徴を同時に分析でき,音声認識には有効なパラメータである.今回の音声認識実験では,特定話者が中国語で発声した世界の国名と都市名1000単語を用いた,各単語を5回ずつ発声し,この中の4回分のデータで学習を行い,残りの1回分のデータを認識させたところ,99.0%の認識率が得られ,本方法の有効性が示された.
著者
中村 克行 趙 卉菁 柴崎 亮介 坂本 圭司 大鋸 朋生 鈴川 尚毅
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.7, pp.1143-1152, 2005-07-01
被引用文献数
22

本論文では, 複数のレーザレンジスキャナを用いた歩行者トラッキングの方法, 及び駅での検証実験について述べる.提案手法は, ネットワークを利用して複数のレーザスキャナを同期させ, 得られた足断面のレンジデータから歩行者トラッキングを行う.トラッキングアルゴリズムは次の機能で構成される: レンジデータのクラスタリングによる足候補の検出, 足候補のグルーピングによる歩行者候補の検出, 歩行者候補の動きベクトル検出, 歩行モデルに基づく拡張カルマンフィルタによる既存軌跡の延長処理.提案手法を東京都内の駅構内コンコースに適用した結果, 最大で約150人を同時にトラッキングすることができた.トラッキング精度は, 通勤ラッシュ時において8割を超えた.広範囲における高密度の群集計測への応用が期待される.
著者
山口 修 福井 和広
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1045-1052, 2001-06-01
被引用文献数
48

ヒューマンインタフェースやセキュリティの分野で, 顔画像を用いた個人識別技術が注目されている.本論文では, ポータブルPC上で動作する顔認識システム"Smartface"について述べる.ユーザに負担の少ない顔認識システムを構築するためには, 顔向きや表情の変化といった人物の変動を吸収する認識法が必要である.本システムでは, ロバストな顔特徴点検出法と動画像を用いた個人識別アルゴリズムを採用する.また, それに伴って増大する計算コストの削減法について述べる.実装したアプリケーション機能は, (1)個人識別による音声応答, 環境設定, (2)顔認識付きスクリーンセーバ, (3)リアルタイム変装シミュレーション, である.本システムは, 特殊な画像処理ハードウェアを用いることなく, カメラを接続したPC上でソフトウェアのみで動作する.
著者
澤木 美奈子 村瀬 洋 萩田 紀博 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.10, pp.2480-2482, 1998-10-25

文字や記号などの複数の情報が重畳して記述されている尺八譜を認識する手法について述べる.補完類似度を用いることにより, 複数の情報を独立に扱うことが可能となり, 高い認識率が得られることを示す.