著者
芦田 和毅 永井 弘樹 岡本 正行 宮尾 秀俊 山本 博章
出版者
社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1817-1824, 2005-09-01
参考文献数
20
被引用文献数
11

本論文では, カラー情景画像に現れる文字列を抽出する手法について提案する. ほとんどのカラー情景画像に現れる単語若しくは文字列は, 同じ色とフォントで印刷されている. そこで本手法では, まずエッジに基づき画像を大まかなブロックに分割する. 次にそれらのブロックをクラスタリング手法によって色の類似している領域に分割し, 各領域中に存在する外接最小方形について縦横比, ピッチなどの特徴を用いてそれらを統合し文字列パターンの候補を得る. 更にこれらの候補に対して幾何学的特徴を求めてSVMにより文字列パターンを識別する. ICDAR 2003 Text Locating Competitionで用いられた251枚のカラー情景画像について実験を行い, 本手法の有効性を確認した.
著者
大西 正輝 泉 正夫 福永 邦雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1590-1597, 1999-10-25
被引用文献数
24

近年,ネットワーク技術の発展に伴い,映像情報などの大容量データ転送が可能となり,大学や各種の学校ではサテライトシステムなどを用いた遠隔講義が行われている.講義風景を撮影する方法として,1台の固定したカメラを用いる方法や,複数台のカメラをディレクタなどが各時点でスイッチングする方法が考えられる.しかし,前者では講義の臨場感が伝わらず,また板書が見にくいといった問題点があり,後者ではカメラを制御する人手が必要となる.本論文では,動画像処理により講義映像の撮影・編集を自動化する手法を提案する.まず,映像中に発生した画素ごとの情報量を定義する.次に,その情報の分布に基づいて複数台のカメラを制御し,あらかじめ生成したスイッチング規則に従い映像の選択を行うことで,受講者に必要な情報を多く含む臨場感のある講義映像をリアルタイムで生成する.また,受講者の視認テストにより本手法の有効性を確認した.
著者
尾上 博和 塩野 充
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.3, pp.483-492, 1994-03-25
被引用文献数
14

自動車ナンバープレートは,その自動車に固有のものであり,その中に書かれている文字すべてを認識することで,全国で登録されているすべての自動車の中から1台の車両の特定を行うことができる.しかし従来の研究の多くはナンバープレート中の大きな数字4けた(一連指定番号)だけを認識するにとどまっており,犯罪捜査や盗難車の発見などの全国規模における完全な車両特定には不十分である.そこで本論文では,車両の前方から撮影した画像からナンバープレートを抽出して,その中に書かれている文字すべてを認識する手法を提案する.本手法はハフ変換とナンバープレートの形状特徴を用いてナンバープレート領域の抽出を行い,またナンバープレート内の文字の存在位置の特徴を用いて各文字を切り出して,認識を行っている.認識結果は,160枚のサンプル画像を用いて,ナンバープレートの抽出と文字切出しの成功をも含めた総合認識率87.5%という結果を得た.
著者
内野 一 白井 諭 横尾 昭男 大山 芳史 古瀬 蔵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1167-1174, 2001-06-01
被引用文献数
1

機械翻訳システムの有効な活用として, 市況速報記事を対象にした日英機械翻訳システムを開発した.システムは, ルール型翻訳とテンプレート型翻訳とのハイブリッド構成であり, 実験では, 文単位で90%, 記事単位で70%の高い翻訳正解率を得ることができた.この評価結果に基づき, 更に対象を決算速報記事に限定し, テンプレート型翻訳による自動翻訳システムALTFLASHを構築した.ALTFLASHは日本語の決算速報を英文で配信する実用システムとして導入され, 従来人手で行われていた翻訳作業に比べ, 処理時間, 翻訳品質, 費用などの面で大幅な改善効果を示した.
著者
高木 秀彦 水野 政司 郷原 一寿
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.2, pp.422-430, 1994-02-25
被引用文献数
11

リカレントニューラルネットワークに複数の時系列入出力パターンが連続的に提示される場合に適用可能な,時間前向き計算による教師あり学習法を提案し,計算機実験によってその有効性を示す.更に,学習過程および学習結果の解析を行い,提案する学習法により所望の時系列入出力パターンの変換を満たすアトラクタが状態空間に形成されることを示す.そして,リカレントニューラルネットワークにより時系列パターンの変換を行うためには,時系列入出力パターンに対応したアトラクタを考慮することが重要であることを指摘する.
著者
吉村 ミツ 吉村 功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1764-1773, 1997-07-25
被引用文献数
12

本論文は旅行小切手上に書かれた日本人の署名を自動的に照合するシステムについて述べている. 日本人の名前は, 通常3個ないし5個の漢字, 平仮名, 片仮名からなっている. 署名をするとき日本人は, たいていの場合その名前を構成文字間に空白をおいで書く. この空白を利用すると署名は各構成文字に分離できる. 本論文の筆者らはこれに着眼した署名照合システムを作り, その性能を実験を通して吟味し, 次の結果を得ている. 1.上段に書かれた1個の純正署名のみを参照して下段に書かれた署名を照合する場合には, 誤照合率を40%以下にすることができない. 2.純正署名を5個参照できる場合には, 誤照合率を16%程度に小さくすることができる. 3.署名を各構成文字に分離して照合を行うと, 分離しない場合に比べて誤照合率を7%程度小さくすることができる. 4.誤照合率は個人によって大きく異なり, 純正署名を5個参照できる場合, いつも安定していて他人にまねされにくい署名では誤照合率が0%になるが, 不安定な書き方の署名では誤照合率が30%以上にもなる. 本論文は, 以上の実験結果から, 旅行小切手で署名照合を有効に行うには, 純正署名を複数個利用できるようにすることが望ましいと結論づけている.
著者
柳沼 良知 坂内 正夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.747-755, 1996-05-25
被引用文献数
42

動画像という一つのメディアを用いただけでは, その自動認識, キーワード抽出や構造化には限界があるのが現状である. 一方, ドラマ映像には映像だけではなくそれに付随する音声やシナリオ文書といった複数のメディアが存在する. そして, これらは比較的容易に利用できることが多い. このため, これら複数のメディアの認識を協調し助け合うことで, ドラマ映像のより高次な構造化・データベース化を行える可能性がある. 本論文ではドラマ映像を対象とし, 映像, 音声, シナリオ文書のDPマッチングを用いた対応付け手法の提案を行う. また, その結果を用いたドラマ映像の意味的な分解, 特定人物の検索といったドラマ映像のデータベース化手法の提案を行う. 更に, 本手法の有効性を示すため実際に複数のドラマ映像を用いて行った実験および評価について議論し, 本手法がドラマ映像の構造化, データベース化に十分有効であることを示す.
著者
増田 一 大堀 隆文 渡辺 一央
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.2, pp.397-404, 1994-02-25
被引用文献数
5

KL(Karhunen-Loeve)変換を可能とする3層構造ニューラルネットを提案した.このニューラルネットは次の構造的特徴を有する.(1)入力層N(=入力次元数)個,中間層R(≦N)個,出力層N行×R列個の線形ユニットをもつ.(2)出力層第r(=1,2,…,R)列ユニット群は,中間層第rユニットと係数ベクトルW_r={W_<nr>;n=1,2,…,N}を介して結合し,かつ出力層内で同行前列ユニットから係数1の加算的結合を受ける.(3)中間層第rユニットは,入力層全ユニットと従属的係数W_r/∥W_r∥^2(∥・∥はノルム)を介して結合する.この並列出力形ニューラルネットの入力層-出力層各列間で恒等写像学習を行わせると,大局最適解に心ず収束し,収束後中間層第rユニットから入力標本の第r次KL変換成分が直接得られることを理論的に示した.また,高速な収束が期待できる簡単な学習則を示した.更に,(1)入力標本群の共分散行列Cが正則,(2)Cが非正則,(3)Cが多重の固有値をもつ,三つの場合についてシミュレーションを行い,理論の妥当性と学習の高速性を検証・確認した.
著者
池野 英利 神山 斉己 臼井 支朗
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.76, no.5, pp.1047-1054, 1993-05-25
参考文献数
9
被引用文献数
5

生物神経系は神経細胞の電気・化学的特性によって実現された高度な情報処理機構を備えている.細胞膜を通過するイオン電流は神経細胞の電気的特性を規定することから,神経回路の機能に対しても影響を及ぼす.このことから,イオン電流のモデル記述およびこれに基づく生理工学的解析は,神経系における情報処理機構の解明にとって極めて重要なアプローチの一つである.イオン電流は膜電位固定実験法によって測定でき,その動的,かつ非線形な特性はHodgkin-Huxley型方程式によって一般的に記述される^<(1)>.しかしながら,この方程式に含まれる時間および膜電位に依存した複雑なパラメータを実験データから推定する方法は確立されておらず,このことはモデル記述を得る上で大きな問題であった.本論文では,4種類の膜電位固定実験プロトコルによって測定されたイオン電流に対し,非線形最適化法を用いた系統的パラメータ推定法を提案する.本方法をHodgkin-Huxleyのナトリウム,カリウム電流モデルによって生成した模擬実験データに適用し,イオン電流特性および細胞応答の再構成を通じてその有効性を示した.
著者
川端 豪
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.10, pp.1967-1972, 1994-10-25
被引用文献数
14

音声による会話は,人間と機械の情報交換の手段として最も快適なインタフェースと考えられ,その実現には,効率的な自然言語処理の技術が必要となる.本論文では,自然音声言語の複雑性を軽減する一手法として,統計的手法に基づく新しい話題制御の機構を提案する.入力音声は予測型CFGを用いて解析されるが,このとき生成される文法規則の系列を用いてHMMを駆動し,その状態分布の偏りとして話題を同定する.逆に,この分布の偏りを動的に文法規則の確率に反映させることによって認識探索空間を絞り込む.大規模対話テキストデータベースを用いて,テキストデータ入力に対するパープレキシティの削減効果を評価し,提案する手法が強力な探索空間の絞込み能力をもつことを確認した.
著者
丸山 一郎 阿部 芳春 江原 暉将 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.2, pp.184-192, 2002-02-01
被引用文献数
9

本論文では,事前収録されたテレビ番組に対して番組VTRと事前電子化原稿から聴覚障害者向けの字幕を自動的に付与する技術の中で,音声と字幕の同期タイミングを検出する字幕提示タイミング検出手法について述べている.背景音が重畳している放送音声に対しては,音素HMMワードスポッターだけに基づいたタイミング検出手法では十分な検出精度が得られない.番組の原稿中の各文に対してワードスポッティングにより複数のタイミング候補を検出し,音響的なゆう度に加え三つのスコア(原稿の時間順序,原稿から推定される発声時間との比,音声らしさ)を用いた動的計画法を行い,番組全体として最適なタイミングを選択する手法を提案した.ドキュメンタリー番組10回分を対象とした評価実験において,許容検出誤差を1秒とした場合に検出率99.0%,3秒とした場合に99.7%の検出精度が得られ,実用的な方式であることが示された.
著者
今村 弘樹 剣持 雪子 小谷 一孔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.12-22, 2002-01-01
被引用文献数
6

動物体解析の有力な手法としてオプティカルフロー推定法がある.しかし, 照明条件の変化する状況下においてフローの推定精度が低下するという問題点がある.この問題点を解決するためにいくつかの手法が提案されている.これら従来手法はそれぞれ異なる特性を有している.本研究は, 従来手法の特性をすべて有する高精度なオプティカルフロー推定法の提案を目的とする.
著者
大淵 康成
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.5, pp.821-832, 2005-05-01

複数のマイクを使った音声認識において, 個々のマイクへの入力の品質が大きくばらついていることがある.そのような場合, それらの入力を重ね合わせることより, 最適なマイクを正しく選ぶことが重要である.本研究では, 同一発声に対する複数チャネルの音声データをもとに, 音声認識に最も適したチャネルを選択する手法として, デコーダに基づくチャネル選択(Decoder-based Channel Selection: DBCS)を提案する.各チャネルの評価には, 従来用いられていた信号対雑音比や音声認識ゆう度などに代わり, デルタケプストラム正規化方式による特徴補償前後の認識仮説の比較に基づく手法を導入する.また, この手法を様々なマイクの組合せからなる部分遅延和アレーと組み合わせることにより, 更に性能向上が得られることを示す.評価実験の結果, デルタケプストラム正規化, チャネル選択, 部分遅延和アレー利用の三つの方式が相補的に働き, 全体として従来の遅延和アレー方式に比べると, 二つの評価データセットに対してそれぞれ35.8%/26.8%の誤り削減率が得られた.
著者
大場 敏文 金子 正秀 原島 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2254-2258, 1997-08-25
被引用文献数
2

福笑いモジュールによって作成された合成顔画像を検索キーとして用い, 検索者の意図を反映した類似尺度に基づき, 顔画像をインタラクティブに検索する方法について述べる. 特徴量空間において, 特徴量ベクトルが互いになす角度が小さいものほど類似評価が高いとする類似尺度を用いることにより, 強調表現された合成顔画像を介して, 検索者の意図を反映した顔画像検索が行えるようになった.
著者
熊本 忠彦 伊藤 昭 海老名 毅
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.6, pp.1114-1123, 1994-06-25
被引用文献数
16

筆者らは,自然言語を用いた対話によってユーザ(computer user)の計算機利用を支援する対話型ヘルプシステムの構築を行っている.ユーザは,通常は計算機上でタスク(task)を進めるが,何らかの障害/問題が生じたとき,ヘルプシステムに音声で支援を求めることができる.ヘルプシステムは,ユーザの音声発話を理解し,その時々の状況に合わせて適当な応答を生成する.ヘルプシステムにユーザ発話を理解させるためには,音声処理技術だけでなく,話し言葉の特性に対応した言語処理技術も要求される.我々は,ヘルプシステムの代わりに人間アドバイザが支援するという擬似的な「対話による支援」実験を行い,ユーザの音声発話を収録し,ユーザ発話データベース(書き起こしテキスト)を作成した.また,その書き起こし文を解析し,支援要請発話(アドバイザに支援を要請するための発話)の特徴を調べた.本論文では,その解析結果に基づいて,ユーザ発話意図の記述形式を定義し,発話文から発話意図を認識する手法(発話意図記述を生成する手法)を提案する.
著者
森 稔 倉掛 正治 杉村 利明 塩 昭夫 鈴木 章
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J83-D2, no.7, pp.1658-1666, 2000-07-25

映像から切り出されたテロップ文字の認識では,輪郭形状の鋸状劣化及び背景の残存ノイズが問題となる.本論文では,この問題に対処する(1)輪郭形状の劣化にロバストなWLDC特徴と(2)ノイズの影響を抑制する動的修正ユークリッド距離を用いたテロップ文字認識手法を提案する.(1)は,背景及び文字両領域の形状を記述・正規化することにより,輪郭形状の劣化に対するロバスト性を高めた特徴である.(2)は,局所領域ごとに画素の変動量を求め,画素の変動量に応じて距離値を修正することにより,ノイズの影響を動的に抑制する識別関数である.人工的に画質を劣化させた文字を用いた認識実験の結果,各提案手法は劣化文字に対して従来手法より大幅に認識率が向上することを確認した.また,実映像中のテロップ文字を用いた認識実験では,提案手法により識別率73%,第10位累積分類率90%の結果を得た.
著者
古宮 誠一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.992-1004, 1998-05-25
被引用文献数
1

ソフトウェアの障害対策作業は, 解散により散らばった旧プロジェクトのメンバが互いに協力して作業を行わなければならない.しかし, 障害対策作業を分担すべき彼らは, 今はそれぞれ新しい作業に従事しており, 新しい作業場所から離れられない.このため, 障害対策作業は, 解散した旧プロジェクトのメンバが, それぞれの新しい作業場所を離れることなく, 互いに協力して障害対策作業を進められることが望ましい.このため, この論文では, そのようなことを可能にするソフトウェア分散開発環境をWWWの上に構築することを提案している.そこでは, ソフトウェアの修正によるディグレードを防ぐために, 対策案の検討過程において, さまざまな視点からのレビューと議論を徹底的に行う必要があるとして, グループワークの利点を生かしてそれらを徹底的に行う, ソフトウェア設計プロセスのモデルを提案し, このプロセスにのっとって対策案の検討作業を行うことを提案している.そして, 協調的に進められる障害対策作業を強力に支援するために, この設計プロセスの中でも特に, 発生した障害の真の原因を同定する過程と, 障害対策のための最適な対策案を複数の中から選出する過程に焦点を当て, これらの過程を支援する方法としてKT法(ケプナー・トリゴー法)の導入を提案し, 具体例を挙げてその適用プロセスを明らかにしている.また, 適用実験により得られたKT法の問題点を列挙すると共に, その対策案を具体的に明らかにしている.これにより, 改良されたKT法による思考手順とその支援環境が, 障害対策作業のための強力な設計方法論とその支援環境となり得ることを示している.
著者
三浦 高志 板垣 史彦 横山 昭彦 山口 百恵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.11, pp.1672-1682, 2002-11-01
被引用文献数
2

本論文は,適応的直交変換によるベクトル量子化において,ベクトル探索を高速化する方法を提案する.高速化の原理は,符号化対象ベクトルの近似に適した辞書ベクトルの探索範囲を絞り込むことで比較回数を削減する方式である.絞込みは,辞書ベクトルを複数の基準ベクトルとの角度の昇順にあらかじめソートしておき,符号化対象ベクトルと基準ベクトルとの角度から近似に適したベクトルの位置を推定し,推定された位置周辺のベクトルだけを候補ベクトルとすることで行われる.また,提案方式の有効性は数値実験により検証される.
著者
山之上 裕一 永山 克 尾藤 峯夫 棚田 詢 元木 紀雄 三橋 哲雄 羽鳥 光俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2522-2531, 1997-09-25
被引用文献数
21

立体番組の撮像においては, 左右カメラの空間的配置やレンズの焦点距離の違いによって, 左右画像間で垂直のずれや傾きのずれあるいはサイズのずれといった幾何学的ひずみが生じる. 本論文ではまず, 最近の立体ハイビジョン番組中の種々の画像を対象に, 幾何学的ひずみがそれぞれ独自に生じた場合の検知限, 許容限を求める. 同時に, その結果に関して, 一般画像間では有意な差が認められなかったことを示す. 次に, 実際の番組収録に照らし合わせて, 幾何学的ひずみが複合して生じた場合についての検討を, 一般画像を対象に行う. そして, 実際に加えた幾何学的ひずみ量から直接その検知限, 許容限を推定する重回帰モデルよりも, 加えた幾何学的ひずみにより生じる対応点のスクリーン上での垂直および水平方向のずれ量から, 検知限, 許容限を推定する重回帰モデルの方が, より汎用性があると同時に分析精度が高いことを示す. 更に, 画像ごとに得られた重回帰式をより一般化することを目的に, 平行性および位置の検定を行い, これらの重回帰式が一つの重回帰式にまとめられることを示す. 最後に, 得られた重回帰式に基づき, 番組収録時の左右カメラの配置・調整のガイドラインについて報告する.
著者
青野 裕司 片寄 晴弘 井口 征士
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J82-D2, no.11, pp.1847-1856, 1999-11-25

本論文では,人間の演奏に反応し即興的合奏を実現するセッションシステムの開発について述べる.本システムの特徴の一つとして,従来のセッションシステムにおいて主流であったMIDI楽器の代わりに,ピアノやギターといったアコースティック楽器を利用する点がある.セッションシステムでは,和音に代表される複合音が入力できること,そして入力された音楽情報をリアルタイムに解析できることが必要である.本システムは,和音構成音のピッチや正確な発音時間といった,詳細な音楽情報は解析の対象としないという制約のもと,楽器音がハーモニックであることを利用した信号処理によって,実時間での和音名の認識を行う.この手法を用いた,3度重ね四和音に対する認識率は,95%を超えることを実験によって確認した.加えて,楽曲の最小反復単位を自動的に抽出する機能をもたせることにより,事前に楽譜を必要としないセッションシステムを実現した.