著者
後藤 真孝 村岡 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.5, pp.901-911, 1994-05-25
被引用文献数
22

本論文では,複数の打楽器のみで演奏された音楽から各打楽器音の発音時刻と強度を認識する音源分離システムについて述べる.音源分離とは,複数の音源の音が混在している音響信号からそれぞれの音を分離して認識する技術であり,曲の音響信号からその楽譜を作り出す自動採譜において,中心となる重要な処理である.従来,楽音を対象にした音源分離システムは研究されてきたが,それらの手法は打楽器音に対して適用することができない.そこで本論文では,打楽器音の音源分離を実現する認識手法を提案する.本手法では,事前に登録してある打楽器音のテンプレートパターンと入力パターンとの距離を,改良したテンプレートマッチングにより求めてしきい値処理する.我々は,音量補正法,音源分離を実現する距離尺度,選択的注意の機構の三つの点でテンプレートマッチングを改良した.これにより,複数の音が混在したり音量が変化した場合にも各打楽器音を認識できる.本システムをワークステーション上に実装し,打楽器音の音源として電子楽器を用いて実験した結果,8Beatのドラムパターンの演奏音を音源分離することができた.
著者
後藤 英昭 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.465-473, 1995-03-25
被引用文献数
8

文字領域の抽出は,文書画像に対して文字認識処理を適用する際の,必須な処理である.本論文では,文書画像から文字領域を抽出する新しい手法:区分直線連結法(Linear Segment Linking)を提案する.本提案手法は,文書画像中の区分直線状の要素を文字行と仮定して抽出するもので,文書構造に関する知識を必要とせず,画像のゆがみなどにも耐性があることが示される.本手法では,画像の中間表現として新しく定めた基本矩形を用いるが,これは行方向にぼかしを入れて抽出される定まった幅の矩形(高さは画像に依存する)である.この基本矩形は,外接矩形よりも容易かつ高速な生成が可能なものとなっている.また,文字行抽出処理の段階で行間の結合(ブリッジ)を強制的に切り離す処理を導入している.これによって,文字行間に若干の接触のある文書からも安定な文字行の抽出が可能となることが示される.
著者
森田 健夫 山口 満 田所 嘉昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.12, pp.2271-2279, 2004-12-01
被引用文献数
19

自動採譜の実現において,音楽信号の音高を推定する処理は最も重要であり,リアルタイムでの処 理が望まれている.本論文では,多重唱を対象とした計算量の少ない音高推定法を提案する.提案法は,1オクターブ12音名に対応するくし形フィルタを並列接続したシステムと,その出力値を利用することで音高を推定する.これは,くし形フィルタが対応する音の全周波成分を除去可能であること,更に,上述のシステムの最小出力を検出することで,入力中の1音を推定できることに基づいており,加減算主体の処理で簡単に実現される.実際の多重音を用いた評価実験を行った結果,従来法(トリー法,SVD法)より,約1/5から1/30の処理時間でほぼ同等の音高推定結果が得られた.
著者
徳元 大輔 池戸 丈太朗 金子 孝夫 片岡 章俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1870-1883, 2004-09-01
被引用文献数
1

今日,ネットワークの双方向性を活用し,情報を受信するだけではなく,ネットワークの情報発信性という特性を有効に活用するためのサービスやシステムが注目を集めている.本論文では,IPネットワークを介して演奏者間のインタラクションがない合奏(以降,遠隔地間の合奏と記述)を行い,更に遠隔地の聴衆に演奏音間の時間同期を確立して,聞かせることができる遠隔合奏システムヘの適用を目的に開発した同期再生技術について報告する.また,音響信号間の時間同期を確立するための同期情報の検出方法としては,帝域制限相関法を考案した.この帯域制限相関法により検出される同期情報の精度を評価した結果, RTP(Real-Time Transport Protocol)によるパケット単位の同期では,最大27msとなる同期ずれを解消することができ,0.1ms以下(サンプリング周波数44.1 kHz)の精度で演奏音間の同期再生を実現できることが分かった.また,開発した同期再生技術を評価するための同期再生実験評価システムを構築し,その性能についても評価を行った.
著者
郭 軍 孫 寧 根元 義章 木村 正行 越後 宏 佐藤 利三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.4, pp.835-842, 1993-04-25
被引用文献数
12

手書き文字認識の高精度化を妨げている大きな障害の一つに,筆記者それぞれの書き方による文字パターンの不規則な変形が挙げられる.手書き文字の個人差の影響を軽減するために,特徴量抽出やマッチング時にパターンをぼかす手法が提案されている.しかし,これらの手法は文字の変形が大きい場合,有効な手法となり得ず,限界があることは一般的に知られている.本論文では,手書き文字の個人差による変形を矯正し,高精度に認識する新しい手法として余弦整形変換を利用した手書き文字認識アルゴリズムを提案する.提案する余弦整形変換は,入力パターンに対し,余弦関数の部分的な非線形特徴を利用することによって,文字が上下左右のどちらかに偏っている場合に整形する機能と,最も情報量が集中している文字の中心部分を拡張する機能をもっている.提案アルゴリズムの有効性を検証するために,ETL9Bを用いて認識実験を行った.実験では,100次元程度の低次元特徴量を用い,約60万字について認識実験を行った.その結果,学習データセット(奇数セット)では93.24%,未学習データセット(偶数セット)では91.63%,平均で92.44%と高い認識率が得られた.余弦整形変換を使用しない場合に比べ,平均して5%以上認識率が高くなっていることおよび品質の悪いデータセットほど認識率の上昇度が大きいことから,提案する余弦整形変換は手書き文字認識において極めて有効であることがわかった.
著者
松尾 賢一 上田 勝彦 梅田 三千雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1617-1626, 1997-06-25
被引用文献数
56

2値画像の単純さを表す尺度とされる複雑度および平均隣接数を用いて, 適応しきい値法に基づく情景画像からの銀行看板上の文字列抽出方法について述べる. 明度情景画像に対して各明度値をしきい値として2値化し, 複雑度あるいは平均隣接数を求めて変化を曲線に表す. この変化の極大となる点より, 比較的単純な2値画像が得られる複数のしきい値を定める. これにより, 明度情景画像を複数枚の分解画像と呼ぶ2値画像に変換する. そして, 分解画像内における閉領域の外接方形の形状から閉領域を3種類に分類する. このうち文字領域候補として分類された方形に対して文字列の連結性を規定する4条件を設定し, それをもとに分解画像ごとに文字列領域候補を決定する. 次に, 分解画像ごとに得られた文字列領域候補を重畳した文字列統合画像を作成し, X軸方向における文字総数ヒストグラムより, 文字列候補の出現頻度を求め文字列領域を抽出する. 本手法より, カラー情景画像100枚中450文字を対象に文字列抽出実験を行い, 分解画像の作成に複雑度を用いた手法から, 文字領域抽出率93.3%, 文字列領域候補抽出率85%, 文字列領域抽出数は100列中97列の結果が得られた.
著者
河田 岳大 工藤 峰一 外山 淳 中村 篤祥
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.629-635, 2005-03-01

OCRなどを通して得られる日本語文の認識結果において, N-gram確率を利用した高速な誤認識文字検出法を提案する.日本語のように単語が分かち書きされず大規模な語彙を対象とした場合, 誤り個所の指摘に文字N-gramは有効な方法である.本論文ではまず, 通常のN-gram確率の拡張として両方向N-gram確率を提案し, その有効性を情報量の点から考察する.次に, 両方向N-gram確率と文脈確率を用いて1文字の誤字を検出する方法を提案する.シミュレーション実験では, 適合率80%において従来法よりも10%以上高い約75%の再現率を達成できた.また, 誤り範囲の指摘という点では, 適合率80%で再現率90%が達成された.
著者
竹谷 誠 佐々木 整
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.336-347, 1997-01-25
被引用文献数
48

学習者の認知構造を表現した認知マップは, 教育測定評価の観点から, その有効性が指摘されている. 本論文では, 教師が構築した認知マップを基準として, 各学習者がそれぞれの理解内容に基づき描画した認知マップを比較・分析し, 各学習者の認知・理解の程度を評価する新しい形成的評価法を提案している. はじめに, 認知マップにおいて, 従来の2項関係間の距離の概念を発展させた, 「質的な距離」, および要素間の一つの関係が他の要素間の関係にどの程度寄与しているかを測る尺度として「重要度」の概念を提案し, それぞれの特性を解析する. 次に, それらの概念を用いた, 二つの認知マップにおける類似度を提案し, 類似度による学習者の理解度の評価法を提案する. 最後に, 実践データをもとにして, 学習者の理解度の評価法ならびに認知・理解を効果的に高めるための再指導の手順を示し本分析法の形成的評価への適用の有効性を示す.
著者
全 炳河 徳田 恵一 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1593-1602, 2004-08-01
被引用文献数
1

近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13〜15%誤り率を削減することが示された.
著者
佐藤 紀章 萩原 将文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.622-629, 2002-04-01
被引用文献数
1

本論文では視覚システムに基づく動物体認識ニューラルネットワークを提案する.提案ネットワークは,視覚情報処理の並列階層性に着目した構造となっており,動物体を認識することができる.提案ネットワークは運動認識モジュール,動物体推定モジュール,動物体認識モジュールから構成される.運動認識モジュールでは視覚において運動認識を行う部分をモデル化したニューラルネットワークを用いて運動の認識を行う.動物体推定モジュールではバックプロパゲーション(Back Propagation:BP)アルゴリズムによる階層型ニューラルネットワークを用いて運動の特徴から動物体の推定を行う.動物体認識モジュールでは抑制方法を改良した多重構造ニューラルネットワークを用いて動物体を形の特徴から認識する.運動認識モジュールから動物体推定モジュールを通して動物体認識モジュールへ情報を伝達することによって運動認識,パターン認識の統合を行い,動物体を認識することができる.歩行人物認識の計算機シミュレーションにより提案ネットワークの有効性が示されている.
著者
荒木 健治 高橋 祐治 桃内 佳雄 栃内 香次
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.3, pp.391-402, 1996-03-25
被引用文献数
19

我々は, 人間の言語および知識獲得能力の解明とその実現を目的として研究を行っている. このような研究はこれまでいくつか存在するが, 工学的に有効なシステムを完成するまでに至っていないのが現状である. また, 心理学の立場からの研究も存在するが, これらの研究は工学的にどう実現するかという問題は対象としていない. そこで, 本論文では, この言語および知識獲得能力を工学的に実現する一つの試みとして, 入力べた書き文とその漢字かな交じり文より帰納的に語の読みと表記を獲得し, その獲得状況および変換精度に基づく確実性の高い語より順に変換するという帰納的学習によるべた書き文のかな漢字変換手法を提案する. 本手法は辞書が空の状態からでも学習機能により語を獲得することができるので, 辞書を個人ごとに自動的に作成することが可能, 個人用辞書とすることにより辞書容量を少なくできる, 未登録語の自動登録が可能, 初期辞書作成の労力を回避できるという利点がある. 本論文では, 更に本手法に基づく実験システムを作成し, 異なる4分野の論文40編を用いて本手法の学習機能による適応性能を確認するための実験を行った. 実験の結果, 4分野すべてにおいて90%以上の精度が得られ, べた書き文のかな漢字変換における本手法の有効性が確認された.
著者
木村 彰男 渡辺 孝志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.4, pp.726-734, 1998-04-25
被引用文献数
16

入力画像からある特定の図形を相似変換不変な形で検出する問題は, 画像認識における基本的な研究課題である.Ballardによって提案された一般化ハフ変換(GHT)は, この種の問題に対処するためのプロトタイプとして知られており, その耐ノイズ性, 処理の柔軟さ, アルゴリズムの簡明さ, といった点で優れた手法である.しかしGHTには, 輪郭点ごとに正確なこう配情報を必要とする, 処理時間がかかる, といった問題点もある.そこで本論文では, これらの問題点に対処可能な新しい手法として, 高速一般化ハフ変換(FGHT:Fast Generalized Hough Transform)を提案する.FGHTでは, チェック点の導入で投票そのものの信頼性を高め, より高精度な図形の検出を実現している.更に, 線分近似を併用することで, 従来手法に比べて大幅な処理速度の向上を実現している.提案手法の有効性を検証するために行った評価実験では, 良好な検出結果が得られた.
著者
安本 護 本郷 仁志 渡辺 博己 山本 和彦 輿水 大和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1772-1780, 2001-08-01
被引用文献数
27

本論文では,複数方向の顔画像から抽出した4方向面特徴を用いて,顔向きによらない人物識別と人物によらない顔向き推定を実行する手法について述べる.また,複数のカメラで異なる方向から画像を取得し,各カメラの識別器出力を統合するマルチカメラ協調手法も提案する,人物識別実,験では,1台のカメラで296°の顔向き範囲に対して平均92.9%の認識率が得られた.顔向き推定実験からは,推定誤差の平均が4.5°以下,分散が11.0という結果を得た.また,8台のカメラから得た情報を統合する処理が,人物識別のオクルージョン耐性や顔向き推定の精度向上に効果的であることを示した.
著者
太田 健一 中田 昌 宮脇 冨士夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.8, pp.1196-1204, 1995-08-25
被引用文献数
1

最近, 日本の夜空が明るすぎ,「光害」と呼ばれる公害が存在することが知られてきた.夜空の光量の絶対値を測定することは, この新たな公害のレベルを知る上で重要であり,特に簡単で高精度の計測手法の開発に対する要求が大きい.本論文では,冷却CCDにカメラレンズを結合して夜空の光学画像を得て,夜空の明るさを計測する手法を提案する. この方法では,観測画像に映る個々の星の除去が必要であるが,基本星表との照合は行わない.一般的に「周囲より明るい微小像が星である」と視覚が認識することを星像モデルに置き換え,この星像モデルと合致する部分を探す. これは,星像中心となる画素を検出し,星像の裾野を検索して,星像成分の存在する画素を決定して除去するものである. この手法を実際に撮影した夜空の画像に適用し,都市夜光の量の測定について,その有効性の確認を行った. また,フィールド調査で得た画像を処理して,等光度線図作成や離れた地点の絶対値比較ができた.従来の写真濃度を測微光度計で測光する方法と比べて,本法では背景光の平均値と標準偏差などが,短時間で正確に得られた.
著者
丸山 健一 小林 誠 山田 博文 中野 康明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1435-1443, 1999-09-25
被引用文献数
1

本研究の目的は筆記体で書かれた手書き英単語を認識することである.以前の研究では,文字認識部にある一つの手法を用い,その結果を用いて単語認識を行っていた.本研究では複数の文字認識を用い,そこから得られた結果を組み合わせることにより,単語認識率の向上をねらった.手書き英単語認識に適用した実験の結果,提案した手法による単語認識率は単独の認識アルゴリズムを用いたときよりも認識率が向上した.
著者
深谷 亮 山村 毅 工藤 博章 松本 哲也 竹内 義則 大西 昇
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.2, pp.661-672, 2004-02-01
被引用文献数
16

本研究では,他人の文章を真似して作成された文章を発見するための文章間類似度の計算法を提案する.真似した文章の多くは,もとの文章に含まれる文と類似した文から構成され,類義語・同義語へ言い換えることなどにより表層的な表現を変化させる.そこで,本手法では各文章を構成される文単位で照合し,表層的な表現の変化に対応するため単語の頻度と概念辞書を用いる.本手法による類似度により,同一テーマで記述された文章と真似して書かれた文章とを明確に区別することができることを示す.
著者
益子 貴史 徳田 恵一 小林 隆夫 今井 聖
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2184-2190, 1996-12-25
被引用文献数
100

隠れマルコフモデル(HMM)からの動的特徴を用いた音声スペクトルパラメータ生成アルゴリズムに基づく規則音声合成システムの新たな枠組みを提案している.本システムで用いるパラメータ生成アルゴリズムでは,HMMで学習した静的,動的特徴の統計情報に従って連続的に遷移するスペクトル系列を生成することができる.規則音声合成にこのアルゴリズムを適用することにより,滑らかで自然性の高い音声を合成できると考えられる.本論文ではこのHMMに基づく規則音声合成システムの枠組みを示し,韻律生成部を除く合成システムを構築した.生成されたスペクトルパラメータを用いて合成した音声の主観評価実験により動的特徴の有効性を示すと共に,合成単位である音素HMMの構成について,音素環境依存性など,いくつかの検討を行っている.
著者
後藤 真孝 伊藤 克亘 速水 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2330-2340, 2000-11-25
被引用文献数
29

本論文では, 代表的ないいよどみ現象である有声休止(音節の引き延ばしも含む)を自動的に検出する手法を提案する.有声休止は音声対話において発語権の保持等の大切な役割を果たしており, その検出は音声対話システムを実現する上で重要である.従来, サブワード単位に基づく連続音声認識やワードスポッティングの枠組みで有声休止に対処する研究事例はあったが, いいよどみ現象として個々に検出しておらず, その役割を把握して適切に扱うことはできなかった.本手法は, 有声休止中は調音器官の変化が小さいことに着目し, 音韻的に変化が少ない持続した有声音(有声休止音)を検出する.その際, ボトムアップな信号処理によって, 有声休止音がもつ二つの音響的特徴(基本周波数の変動が小さくスペクトル包絡の変形が小さい)を検出することで, トップダウン情報を使わない言語非依存な検出を可能とする.本手法をリアルタイムに実行するシステムを実装し, 有声休止箇所のマーク付け作業を施した日本語の音声対話コーパスを用意して, 評価実験を行った.その結果, 30名の話者の自然発話に対し, F値0.726の精度で有声休止を検出できることが確認された.
著者
坂口 貴司 岡林 孝志 金森 務 井口 征士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.10, pp.2385-2393, 1998-10-25
被引用文献数
7

人間の身体ジェスチャには豊かな情報が含まれており, マン・マシンインタフェース, マン・マンインタフェースの有力な手段と考えられる.本論文ではオクルージョンの心配がなく外部磁界環境の影響も受けないという特長を有する運動覚センサ(ジャイロセンサ, 加速度センサ)に筋電位センサを組み合わせて, ニューラルネットワークで統合化するジェスチャ計測および認識手法を提案する.これらのセンサはジェスチャが表現している意味の強さ(例「とても」, 「やや」など, ここではバリュー情報と呼ぶ)を加速度, 角速度, 筋力情報という形でうまく検出してくれる.14種類のジェスチャ(手話動作)について認識実験を行い, 筋電位情報がバリュー情報認識に有効であること, 本手法により多様なジェスチャに関してシンボル情報だけでなくバリュー情報が認識できることを確認した.
著者
小松 隆 岩間 徹 齊藤 隆弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1912-1919, 1998-08-25
被引用文献数
14

古い映像フィルムの画質劣化の要因の一つであるブロッチの検出とその修復を行う方式を提案する.ブロッチにより損傷を受けた画像に対しても適用可能な動き解析法を提案する.更に, 動き解析の結果得られた動き量で動き補正画像を複数作成し, 着目画像とこれらの画像との最小差分からブロッチの検出と修復とを行う方式を提案する.人工的にブロッチを付加した画像を用いたシミュレーションにより, 提案する動き解析法がブロッチに対してロバストであることを示す.また, 提案する修復方式の性能評価実験の結果を示す.