著者
願 力栩 田中 直樹 金子 豊久 Haralick R. M.
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2696-2704, 1997-10-25
被引用文献数
30

文字は主に細長い線分で構成されることから, 画像中に存在する文字領域は「細長い領域」を検出することにより抽出が可能と考えられる. 本論文では, まず数学モルフォロジーを用いて濃淡画像における領域の幅(文字線幅)を得る方式について述べ, 更にそれに基づく文字領域抽出方式について述べる. 本方式は, 多様な背景部をもつ画像に適用可能であり, 背景部と文字領域が複雑に入り組むような場合にも単純な画像の場合と全く同等に処理できる. 雑誌の表紙画像を実験対象として文字列抽出実験を行った結果, 白黒濃淡画像に対して81%, カラー画像では95%の抽出結果を得ることができた. また, 解像度の関係で, 今回用いた最小の構造化要素と同等の文字サイズしかもたない小さな文字を除くと, それぞれ92%, 100%の抽出結果を得ることができた.
著者
高元 政典 山田 直之 小林 康弘 野中 久典 大越 茂
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.10, pp.2075-2082, 1994-10-25
参考文献数
12
被引用文献数
4

工業プラントの建設工程計画作成では,各作業単位に必要な資源量から算出する毎日の必要総資源量の変動やピークはできるだけ小さい方が望ましい.縦軸に必要総資源量を,横軸に時間をとり,必要資源を山積みで表すと,必要総資源量の変動やピークの最小化はその山積みの平準化に相当する.この山積みの平準化には,平準化に伴い単調増加または減少する関数を目的関数として各作業単位の開始日を決定する最適化問題を効率的に求解する必要がある.しかし,工業プラントの建設は,作業単位が100以上,建設に要する全期間が1,000日以上と大規模な場合が多く,上記最適化問題の大域的最適解の求解は困難である.また近似解法であってもその求解効率が問題となる.そこで,本研究では,必要資源量の山積みの平準化を目的とした大規模最適化問題に対し,近似解を高速に求解するアルゴリズムを開発した.本アルゴリズムは,最適化問題を定式化した0-12次計画問題に対し,平準化のために設けたピボット変数選択規則によるピボット操作を繰り返して準最適解を高速求解する.本アルゴリズムを実際の工業プラントと同規模の例題へ適用した結果,よい近似解を数分(計算機性能:28MIPS)で得るこができ,アルゴリズムの有効性を確認した.
著者
坂本 靜生 宮尾 陽子 田島 譲二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1796-1804, 1993-08-25
参考文献数
12
被引用文献数
20

顔画像から目の構造特徴を検出する新しいアルゴリズムを提案する.従来のエッジベースの手法では,ノイズや経年変化に弱く,特に目尻点の検出において満足な結果を得ることが困難であった.そこで,より多くの画像特徴を利用するために,新しくエッジと領域を検出する画像解析方法を提案する.本方法により得られる画像特徴と,手入力により抽出した目構造とを比較することにより,ノイズや経年変化に強い目構造を新しく定義し直す.目の部分画像から目構造を自動抽出する,論理演算を主体としたシンプルな構成をもつ,パラメータの少ないアルゴリズムを提案し,日本人成人男子100名の右目部分画像に適用した.その結果,従来手法では検出することが困難であった画像に対しても良い結果を得ることができた.
著者
川谷 隆彦 清水 裕之 マッキーチャン マーク
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1742-1751, 1997-07-25
被引用文献数
10

本論文は筆者の一人が先に提案したLDA法の改良と手書き数字認識への応用について述べている. LDA法ではフィッシャーの判別分析で求められる判別関数を原距離関数に重畳することにより原距離関数のパラメータの学習を行う. 判別分析においては, 判別すべき二つのパターン集合を1次元の軸z上に射影する. 今回新たな問題点として, LDA法では判別関数に1次の項のみならず2次の項まで用いるためにz軸上の分布は対称にならないこと, また, そのために最適な判別関数が求められず認識精度の向上に限界があることが判明した. 本論文では, 非対称性の影響を軽減させる方法を提案し, NISTのデータベースに含まれる手書き数字を用いた認識実験によりその効果を確認している. また, 誤読パターンの傾向の評価, および人間の読取り結果との比較を通じ, OCRの読取り能力は人間のそれにかなり接近してきていることを示している.
著者
山本 正信 川田 聡 近藤 拓也 越川 和忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.1, pp.71-83, 1996-01-25
参考文献数
25
被引用文献数
78

本論文では, 3次元的に動作を行っている人間を動画像により追跡する手法を提案している. この手法は, まず人体の立体形状をあらかじめCADモデルで構成しておき, このモデルを追跡開始フレームで人体像に一致させておく. 追跡は運動パラメータの推定と, 得られたパラメータに基づくモデルの移動を交互に繰り返すことにより達成される. 運動パラメータは人体をロボットとみなしたときのアームパラメータである. パラメータの推定は時空間こう配法による直接推定である. 実際に, 階段を下りる, 椅子から立ち上がる, コーナを曲がる,などの動作の動画像追跡により本手法の有効性を確認している. また, 追跡結果をCGアニメーションにより再現し, 3次元の追跡であることを強調している.
著者
山森 一人 阿部 亨 堀口 進
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.350-353, 1997-01-25
被引用文献数
4

ニューラルネットワークにより実用規模の問題を解くためには, 並列学習法による高速化が必要である. 本報告では, 超並列計算機上に3種類の並列学習アルゴリズムを実装し, その性能について議論する.
著者
山森 一人 堀口 進
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.2, pp.370-377, 1998-02-25
被引用文献数
8

ニューラルネットワークを用いた情報処理は制御やパターン認識などの分野で広く応用されている.しかし, 問題が大規模化するに従ってニューラルネットワークの学習に必要な時間が膨大になる.近年, 大規模ニューラルネットワークの学習を並列計算機を用いて高速化する研究が盛んに行われるようになった.しかしながら, これらの並列化手法は並列計算機のアーキテクチャに強く依存している場合が多く, 誤差逆伝搬学習法の並列化性能については十分に検討されていない.本論文では, 誤差逆伝搬法がもつ3種類の並列性を利用した並列学習モデルを解析し, その並列学習速度について詳しく検討する.これらの並列学習に関する解析結果を用いて実際の並列計算機上へ各モデルを実装して並列学習法の性能評価を行う.
著者
服部 数幸 佐藤 幸男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1528-1535, 1993-08-25
参考文献数
12
被引用文献数
38

本論文は時系列空間コード化法に基づいた新しいレンジファインダのシステムについて述べている.光パターンを生成する光源としては半導体レーザを用いており,レンズ系によって生成されたスリット状の光をパターンに従い時系列的にスイッチングしながらガルバノミラーで走査して光パターンを生成している.レーザおよびミラーはCCDカメラの垂直同期信号と同期して動作し,カメラの1フレーム時間内に各光パターンが生成され,その投影像が撮像される.光パターンの生成,切換えにむだ時間がないため,約0.3秒で8枚の光パターンの照射と撮像が行われ,距離測定精度が約1%の512×256画素の距離画像を得ることができる.光学系は極めて小型に形成され(W:140mm,H:35mm,D:95mm),軽量であるため(680g),ロボットの視覚など広い用途が見込まれる.本論文ではレンジファインダのシステムの構成,専用画像処理システムについて述べている.またいくつかの計測結果を示し,本システムの有効性について論じている.
著者
農宗 千典 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.514-523, 1993-03-25
参考文献数
17
被引用文献数
36

単眼視による連続道路画像を処理し,道路中央からの偏位,道路に対するヨー角,ピッチ角,ロール角,路面からの高さという,5自由度カメラ姿勢と,道路のカープ曲率とこう配曲率を含む3次元構造とを,同時に計測する手法を提案する.時変の道路形状パラメータで表現された3次元道路モデルを作成し,前時刻における姿勢パラメータを用いて画像座標系に変換する.そして,モデルと入力画像との対応関係から各姿勢パラメータと道路形状パラメータの変動量を同時推定する.推定は線形方程式で行え,よって高速処理に向く手法である.合成道路画像を用いた定量評価と実画像による実験において,精度の良い推定結果が得られた.従来固定値とされる場合の多かったピッチ角やカメラ高などの推定が,自動操縦の場合重要とされる道路形状や偏位やヨー角の計測精度向上に寄与することも確認された.更に,高速画像処理装置により実時間(30画面/秒)で処理でき,本手法の有効性を確認した.
著者
有木 康雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2421-2427, 1997-09-25
被引用文献数
32

本論文では, ニュース映像から個々の記事を自動的に切り出す方法を提案している. ニュース映像の各フレームを, 離散余弦変換(DCT)で圧縮し, このとき得られるDCT特徴でシーンカットを検出する. カット検出の従来法では, 隣接するフレーム間の差分をもとにしているため, 画像の一部または全体の明るさが変化する場合に, 誤検出が生じていた. 本研究では, 同一シーン中の連続するフレームは類似しているという性質に基づいて, ニュース映像中のフレームをクラスタリングすることによって, この問題を解決している. ニュース映像は「スタジオから現場に移りスタジオに戻る」というシンタックス上の構造をもっている. この構造は, 検出したカット点フレーム集合においては, ループとして観測されるため, ループ検出によってスタジオを推定し, 記事を切り出している. NHKのニュース30日分に対して実験を行い, カット検出率87.9%, 記事切出し率99.2%を得た. また, 民放3社のニュース10日分に対して, 記事切出し実験を行いその有効性を示した.
著者
川崎 順治 飯島 泰蔵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.4, pp.774-780, 1994-04-25
被引用文献数
37

例えば,白黒2値表示した画像にディザ法をかけると,私たちは,擬似的に中間調が見えてより鮮明な画像として認識していることを経験する.これは,人間が細部に注目しない場合は対象全体を大まかにとらえて,より多値の鮮明な画像を認識できるということである.本論文は,このような外界・網膜・脳を通じて階層的に行われる視覚神経の自然な情報処理の様相を,視覚モデルによってとらえ理論的に明らかにし,実験的に確認した.まず,パルス密度変調されたディジタル画像を外界の入力画像とし,網膜のレベルで視点・視野を考えぼけを含んだ画像として扱い,脳のレベルで関数方程式の解として復元画像を導出した.この解はエルミートの多項式をもち,級数和の項数が漸近級数類似の特性をもつことが示された.すなわち,比較的小さな有限項の最適近似項数で,入力画像を予想どおり原画像のアナログ画像に復元して認識できることが明らかになった.本質を理解しやすくするために1次元モデルとして取り扱われたが,基本的には2次元モデルに拡張されると考えられる.
著者
鈴木 雄仁 斎藤 英雄 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2186-2193, 1997-08-25
被引用文献数
13

現在顔に関する研究がさまざまな分野において非常に重要になっている. これには画像中の顔領域のみを切り出す必要がある. しかし, 従来までの研究では, 任意背景の顔画像に対しては背景のエッジ等に顔の輪郭を誤推定してしまい, 安定に顔領域を抽出できなかった. 本論文では任意背景の顔画像から顔輪郭を推定するために, まず頭部はだ円曲線形状をしており, 頭髪によりその内部は均一な濃度分布になっていると仮定し, 頭部輪郭線に当てはまるだ円を遺伝的アルゴリズムを用いて求める. 次に頭部輪郭線の情報をもとにして顔の顎部分の輪郭線を推定することにより顔領域輪郭の粗推定を行う. そしてこの輪郭線から, SNAKESを用いてより細かな顔輪郭を抽出する手法を提案する. 更に, 本手法を任意背景顔画像に適用してその有用性を示す.
著者
間瀬 久康 佐藤 智夫 宮崎 保光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.1, pp.149-154, 1993-01-25
被引用文献数
2

レーザ走査型膜電位計測装置を試作し,コイ心室活動電位を4点より計測し,ガラス微小電極による計測と比較した.膜電位感受性色素として膜電位変化により蛍光放射強度を変化させるWW781を用いた.WW781を0.1mg/mlの割合で生理食塩水に溶解した染色液で,コイより摘出した心室を20分間染色した.光源としてHe-Neレーザ(λe=632.8nm,1.0mW)を用い,音響光学偏向器で1次元のビーム走査を行った.染色後の心室表面にレーザ光を照射し,膜電位感受性色素より生じる蛍光放射強度を1.0msごとに計測した.心室表面上のビームスポット間隔は1.0mmであった.蛍光の受光はホトダイオードで行い,励起光の反射と蛍光の分離は,シャープカットフィルタで行った.活動電位の立上りにおいて,蛍光放射強度は5%程度増加した.最も離れた2点間において,蛍光放射の増加開始時刻に4msの差があった.この時間差はガラス微小電極による計測結果と同程度であった.
著者
平井 俊男 岩橋 直人 樋口 宜男 匂坂 芳典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.11, pp.1572-1580, 1995-11-25
被引用文献数
15

日本語合成音の自然性向上を目指して,音声の基本周波数(以下,F_0)制御のための規則を自動的に抽出する方法を提案した.本方法は,(1)十分な量の音声データのF_0時系列パターンを藤崎モデルによりパラメータ化し,(2)このパラメータの値を言語情報から推定する規則,すなわちF_0制御規則を統計分析手法により抽出する,という二つのステップからなる.この方法を話者1名による読上げ文200文に適用し,得られたF_0制御規則を解析することで,言語情報とパラメータ値との関係を導出した.その結果,(1)先行フレーズのモーラ数が少なくなるほど当該フレーズ指令は小さくなること,(2)アクセント句内の高く発音される部分のモーラ数が多くなるほどアクセント成分が小さくなるという関係があること,が明らかとなった.(2)の関係は,従来少数サンプルの分析結果で得られていた知見を詳細化したものとなっており,本手法によって妥当なF_0制御規則の抽出を自動的に行える可能性があることを示したものと考えられる.
著者
古川 亮 今井 正和 烏野 武
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.6, pp.1054-1063, 1996-06-25
参考文献数
13
被引用文献数
20

連続画像から物体の運動を解析することは, 重要でかつ困難な問題であり, これに対して多くの研究がなされてきた. 本論文で提案するActive Tubesは, 非剛体物体の運動を解析するためのモデルの一つである. このモデルは, Kassらの提案したSnakesを時間軸に沿って重ねたものとみなすことができ, Snakesと同様のエネルギー最小化の手法を用いて時空間画像中の物体を抽出する. 当初, Active Tubesの収束アルゴリズムとして, Greedy Algorithmを用いていた. しかし, Greedy Algorithmはノイズなどの影響を受けやすいため, 新しいアルゴリズムとしてRandomized Greedy Algorithmを提案する. 提案されたアルゴリズムはGreedy Algorithmと同程度に高速である上に, ノイズに対してより頑健である.
著者
藤吉 弘亘 梅崎 太造 今村 友彦 金出 武雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1627-1634, 1997-06-25
被引用文献数
19

本論文では, ナンバープレートの重心位置を出力するように学習させたニューラルネットワークを使用して, プレート領域を抽出する方法を提案し, その有効性を示す. 学習パターンの提示位置は, 乱数で与えられるため, 毎回異なるパターンがニューラルネットワークに学習され, 汎化能力の高いニューラルネットが形成される. 学習パターン中に含まれるナンバープレートの最適学習面積, バンパーとヘッドライト部分の抑制学習による効果, および学習パターンの拡大縮小と濃度値変換による効果について検討する. 地下駐車場で撮影された595台の車に対して評価実験を行った結果, それぞれ98.5%, 98.7%および100%の検出率を得た.
著者
工藤 育男 友清 睦子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.624-635, 1993-03-25
被引用文献数
10

日本語の対話文における省略の補完方法について述べる.日本語の省略には,従来の扱われてきたフォーカスの省略(ゼロ代名詞)とは異なる種類の省略がある.例えば,「〜して頂けませんか」という謙譲表現を使う場合には,「あなたガ,私ニ」が省略される.この省略は,文脈中に照応すべき先行詞が存在せず,述部の表現から推定できるという特色がある.また,フォーカスの省略よりも頻度が多いにもかかわらず,あまり議論されてこなかった.この論文では,このような日本語の述部の語い的特性による省略を扱う機構について提案する.日本語の述部,すなわち,助述表現,動詞の特性,ダ文の補語に着目し,処理を行う.そのために,対話コーパスを用い,大量の例文調査を実施し,述部の語い的特性について省略補完の観点から分類を行う.この分類に基づいて,省略補完機構を実現する.実験の結果は,クローズドデータテストで93.2%の成功を収めた.また,未知の助述表現への対応するための方法として,弛緩法を提案する.情報量として重要でない部分を段階的に落としていき,マッチングを図るものである.この方法で,91.2%の未知の助述表現に対処できることを示す.
著者
荒木 昭一 横矢 直和 岩佐 英彦 竹村 治雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.10, pp.1704-1711, 1996-10-25
被引用文献数
32

従来の動的輪郭モデル(Snakes)では,Snakes内部の複数対象物を独立して抽出できないため,対象物の数だけ初期輪郭を与える必要があった.本論文では,Snakesによる複数対象物の自動抽出を目的として,複数対象物を包含するように初期輪郭を一つ与えるだけで,それらを独立して抽出できるSnakesを実現するため,面積項による収縮型のSnakesが変形の際に自己交差を起こすという挙動に着目し,Snakesを自己交差部分で切り離して複数に分裂させる分裂型の輪郭モデルを提案する.提案手法は,分裂により生じた小さな輪郭モデルを消滅させることにより,画像中に散在するノイズや抽出対象外の小物体に捕獲されにくく,初期輪郭を対象物から離して与えても安定して対象物を抽出できるため,例えば,画像の枠を初期輪郭として,複数対象物を自動的に抽出することもできる.提案手法の有効性を示すため,まず人工画像を用いた動作確認実験を行い,次に実画像を用いた実験として,顕微鏡写真からの複数細胞の抽出および動画像を用いた複数移動物体の抽出・追跡への適用例を示す.
著者
向川 康博 中村 裕一 大田 友一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1555-1562, 1997-06-25
参考文献数
12
被引用文献数
32

本論文では, あらかじめ用意された複数の顔画像を適切に組み合わせることで, 任意方向から見た任意表情の顔画像を生成する手法について提案する. 頭部の3次元形状や, 表情変化のための精密なモデルを用意する必要はない. 顔表面上に配置した特徴点の, 任意方向・任意表情の場合の2次元座標は, 少数の基底ベクトルの線形結合で表現できる. 更に, 特徴点を頂点とする三角形パッチに, 複数の顔画像から得られるテクスチャを重み付け平均してマッピングする. さまざまな表情をもつ顔画像を用意し, 実際の表情変化を素材として用いることで, 自然な表情の見え方を生成できた.
著者
黒瀬 能聿 矢野 米雄 冨田 豊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.4, pp.933-942, 1997-04-25
被引用文献数
21

近年のコンピュータ化により, 大学におけるCAD教育としては, 2次元CADシステムによる単なる製図教育にとどまるのではなく, 3次元CAD教育の必要性が叫ばれている. 3次元CADでは, より自由な形状設計を行うために, 自由曲線や曲面の取扱いが重要なテーマの一つである. 筆者らは, これまで3次元CAD教育を進める上で, 学習者にとって理解が困難であると考えられる自由曲線や曲面の創成教育を支援するシステムを提案した. しかし, これまでのシステムはパーソナルコンピュータによるスタンドアローン環境であり, 教材管理の困難さ, 学習履歴収集の困難さ, マルチメディア化の困難さ等の問題点があった. 一方, 近年のインターネットの普及には目を見張るものがあり, マルチメディア化が可能なインターネットを教育に利用する試みも各地で開始された. インターネットを利用することで, 我々のシステムの問題点は解決する. 本論文では, インターネットを利用した学習支援システムを提案する. 本システムは, インターネット上で展開することで, 大学内だけの利用にとどまらず, 広く学内外からの利用が可能になった.