著者
中川 聖一 山本 誠治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2139-2145, 1996-12-25
被引用文献数
9

本論文では,対話方法と被験者の違いによる振舞いや主観の違いの検討を行うために,"Wizard of Oz法"でインプリメントしたシステムを用いて評価実験を行った."Wizard of Oz法"とは,システムに精通した人(ウィザード)がシステムの代わりに処理を行うことによって,あたかもシステムが存在しているかのように見せかける実験方法である.評価実験で用いたタスクは,"富士五湖周辺の宿泊施設案内"で,対話方法としてはシステム主導型とユーザ主導型の二つを用意した.また,被験者として情報工学系の学生と工学系でない一般の女性を選び,合計16人で実験を行った.評価実験で得られた対話データをもとにユーザの平均発話数,1発話当りのユーザのシステム占有時間,聞き直し,間投詞,言い直し,単語カバー率について詳しく検討した.その結果,ユーザの平均発話数はシステム主導型の方が多くなるが,ユーザのシステム占有時間はユーザ主導型の方が長くなることわかった.また,間投詞,言い直しはユーザ主導型の方が多く出現することわかった.更に,システム主導による入力の方がユーザ主導に比べて使用される単語にかなりの制限が加えられることが確認できた.
著者
崎山 朝子 大平 栄二 佐川 浩彦 大木 優 池田 尚司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.2, pp.182-190, 1996-02-25
被引用文献数
60

本論文では, リアルタイムで3次元コンピュータグラフィックスの手話アニメーションを合成する方法と, その評価について述べる. 聴覚障害者に, より多くの情報を, 状況に合った手話表現で迅速に伝えられるようにするためには, 変更が簡単なコンピュータグラフィックスで手話が表示できる必要がある. 本研究では, 自然な手動作を実現するために, 人間の手動作を計測したデータを用いて手話アニメーションを合成した. また, 3次元空間の手の位置関係を正確に伝えるために, 遠近表現を誇張する方法を開発した. 更に, 作成した手話アニメーションと日常で用いられている実写画像の自然さとわかりやすさをSD法を用いて評価し, 両者を比較した. この結果, (1)手動作のみの手話で, 手話アニメーションで約8割, 実写画像で約9割が正確に伝わること, (2)手話アニメーションの手動作の自然さは, 実写画像に近いこと, (3)手話アニメーションで手の位置関係を正確に伝えるためには, 遠近の誇張だけではなく, 実写画像に近い手の陰影表現も必要であることがわかった.
著者
西村 竜一 西原 洋平 鶴身 玲典 李 晃伸 猿渡 洋 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.789-798, 2004-03-01
被引用文献数
65

実環境下での音声インタフェースの研究プラットホームとして,生駒市北コミュニティセンターの音声情報案内システム「たけまるくん」を開発した.本システムは,大語彙連続音声認識を基礎とする一問一答形式の音声インタフェースをもち,同センターや生駒市に関する受付案内を可能とする.システムはセンターのエントランスに常設され,開館時は誰でも自由にエージェントとのコミュニケーションを楽しむことができる.ユーザとシステムとのインタラクションの観察を目的とした5か月間にわたる本システムのフィールドテストを実施し,ユーザによる発話ログの収集を行った.本論文では,はじめに音声インタフェース部を中心に本システムの構成について説明する.フィールドテストの結果,男女幅広い年齢層のユーザによる発話を含む約1,362分の音声データを収集した.その分析の結果から,大人と子供で発話内容の傾向に違いはあるが,本システムは有効に利用されていることを示す.実験では,実際のユーザ発話によるベースラインの認識性能の評価を行い,大人に対して86%の単語認識率と76%の応答正解率を得ることができた.しかし,子供のユーザに対する精度が十分でないなど,音声インタフェースの実用化に向けて多くの課題が残されていることを確認した.
著者
瀧 剛志 長谷川 純一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1802-1811, 1998-08-25
参考文献数
13
被引用文献数
38

本論文では, チームスポーツにおける集団行動を映像に基づいて定量的に評価するための基本的な特徴量について検討する.ここで提案する特徴量は, 集団動きの中で各個人がつくる一種の勢力範囲である.本論文では, これをボロノイ領域の一つの拡張として定式化し, 人間の近似的な運動モデルを用いた具体的な計算方法を示す.この勢力範囲を実際にサッカーゲームにおける種々の行動評価に応用し, チームワークをボールの受け渡しスペースを維持するための動きであると限定的にとらえれば, その定量化が可能であることを実験的に示す.
著者
清水 雅夫 奥富 正敏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1409-1418, 2001-07-01
参考文献数
9
被引用文献数
35

ステレオ画像処理や各種画像計測, 流体計測の分野では, 領域ベースのマッチングが多く使用されている. 通常は, 画素分解能以上の精度を得るために, 一致度評価値を利用したパラボラフィッティングによってサブピクセル推定を行っている. しかし, その際の推定値の精度や性質に関する研究は少ない. 本論文では, マッチングに使用する画像を特定の関数で近似し, サブピクセル推定における誤差を解析した. この結果から, サブピクセル推定に固有の現象を説明した. 更に, サブピクセル推定における誤差を大きく低減する手法を提案する. この手法は, 一致度評価値の算出方法とは独立で, 実装が容易である. この手法の効果を確認するために, 3種類の画像を使用して実験を行った.
著者
堀 修 三田 雄志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1800-1808, 2001-08-01
被引用文献数
24

本論文では,映像中に現れるテロップの文字部をOCRで判読できるように,精度良く切り出す方法を提案する.従来の研究では,映像中のテロップを背景から切り出す方法としてテロップの輝度が背景に比べて高いことを利用し,しきい値を決めて2値化する方法がとられていた.しきい値の決め方として,背景と文字の二つの輝度の分布を仮定した大津の方法や大津の方法を局所ブロックに用いた塩の方法がある.しかし,映像のように背景に様々な輝度を含むものでは,必ずしも仮定が成り立たず,良いしきい値が得られないという問題があった.また,実際には,影付け,縁取り及び信号変換処理の影響で文字の周辺で必ずしも輝度が高くなく,OCRで判読可能な十分な精度で文字を切り出すことができなかった.そこで,文字部の輝度分布をロバストに推定し,文字部として信頼度の高い領域を最初に抽出し,推定された分布に基づいて領域拡張を行い,文字部のみを切り出す方法を提案する.実,験の結果,従来手法より精度良く文字部を検出できOCR判読率が向上することを示す.
著者
浜田 玲子 井手 一郎 坂井 修一 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.79-89, 2002-01-01
参考文献数
19
被引用文献数
23

筆者らは, マルチメディアの中でもテキストの付随するマルチメディアに注目し, テキストからの情報を画像・音声解析に反映させることで, 実用的な精度のマルチメディア統合技術の実現を目指している.特に, 現在はテキスト教材の付随する料理番組に着目し, 料理映像とテキスト教材の対応付けシステムを開発している.本論文では, このような対応付けシステムの一部分であるテキスト解析部に焦点を当て, 調理手順の構造解析手法を提案した.本手法では, 解析対照の特徴を最大限に利用し, 実用的な処理を目指す.そのため, 対象に固有の辞書を構築し, これを利用した構造解析を行う.本論文では, 評価実験とその結果から, 本手法により高精度で調理手順の構造解析が可能であることを示した.なお, 本手法は付随する映像の存在しない調理手順文書などにも適用可能である.調理手順のような説明的文書は, 調理にとどまらずテキスト教材やインターネット上など様々なメディアから大量に入手可能であるが, それぞれが独自の書式で互いに独立に存在している.本手法は, 従来は難しかったこれらの膨大な情報の活用にも役立つものと考えられる.
著者
西上 功一郎 渡辺 澄夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.86, no.1, pp.119-129, 2003-01-01
被引用文献数
17

情報システムの統計的学習においては,複数のモデルの候補から与えられた規準に対して最も適するモデルを選ぶ操作が必要になる.その規準として,真の分布を最大の確率で見出すための一致性の規準,及び予測誤差を最小にするための有効性の規準がある.正則な統計モデルにおいては,AICやBICなどの規準が提唱され,その性質が詳しく研究されているが,神経回路網や混合正規分布などの特異点をもつ学習モデルの選択のための規準については,不明なことが少なくない.本論文では,特異点をもつモデルのベイズ学習について考察し,確率的複雑さを最小にするモデル選択法において,常に正値の事前分布を用いる方法とジェフリーズの事前分布を用いる方法とを,一致性及び有効性に関する観点から比較する.既に知られている理論的な命題を基盤として,二つの分布の違いについて合理的な予想を行い,その予想を実験的に検証する.特に,学習モデル族が真の分布を含んでいる場合には,ジェフリーズの事前分布が一致性・有効性の両面で優れていること,反対に,学習モデル族が真の分布を含んでいない場合には,常に正値をとる事前分布が有効性において優れていることを実験的に明らかにする.
著者
森本 淳 銅谷 賢治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.2118-2131, 1999-11-25
被引用文献数
42

人間のように多自由度の身体をもつロボットが,試行錯誤的に目的とする運動を獲得することは,ロボット学習の分野において大きな課題である.本論文では強化学習を用いて,ロボットが高次元状態空間中における運動学習を行うための手法,主に評価関数の近似方法についての考察を行う.制御タスクとしては,人間の身体の形を単純化した3リンク2関節ロボットの起き上がり運動を扱う.強化学習の一手法である,連続時間,連続状態のTemporal Difference学習則を,正規化ガウス関数を必要に応じて逐次配置する関数近似手法と組み合わせ,高次元連続状態空間中での起き上がり運動学習を行った.その結果,シミュレーション上で約2400回の試行後に起き上がり運動が獲得された.
著者
竹林 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1417-1428, 1994-08-25
被引用文献数
84

ユーザ中心の音声自由対話システムTOSBURG II(Task-Oriented dialogue System Based onspeech Understanding and Response Generation)についてメディア技術とマルチモーダルインタフェースの観点から論じる.筆者らは,「ユーザに対して何ら制約を設けない」というコンセプトのもとで,雑音免疫ワードスポッティング,キーワードに基づく自由発話理解,ユーザ主導型対話制御,マルチモーダル応答生成,音声応答キャンセル等の要素技術を開発し,それらを統合して不特定ユーザ向きの実時間音声対話システムを開発した.また,実システム上に構築した音声対話データ収集・評価システムは,実音声データと,キーワード検出,音声理解,対話処理等の対話システムの中間処理結果とを記録でき,システム性能評価のほかに音声対話コーパスの構築やヒューマンファクタの評価改良に活用できる.不特定ユーザによる実システムの試用と評価実験の結果,ユーザからの割込み機能,マルチモーダル応答,キーワードに基づく自由発話理解が対話の自然性とロバスト性の向上に有効であることを確認した.
著者
村瀬 洋 シュリー ナイヤー
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.11, pp.2179-2187, 1994-11-25
参考文献数
18
被引用文献数
148

2次元画像から3次元物体を識別し,その物体の向きを検出する技術は,工業部品の分類など実用的な価値は高い.従来の代表的な手法としては,画像からエッジや表面形状などの3次元構造に着目する方法があるが,この枠組みでは3次元構造の抽出自体が困難であり,任意形状の物体に対して高い精度は得られていない.本論文では,2次元照合により3次元物体を認識する手法について述べる.2次元照合による手法は,3次元特徴の抽出が不要である等の特長はあるが,見る方向や光源の位置により複雑に変化する2次元画像をあらかじめ学習しておくことが記憶容量,計算量の点で困難であると考えられ,従来試みられていなかった.本手法では画像符号化を基本としたパラメトリック固有空間法の提案により,少ない記憶容量で3次元物体を2次元画像の集合体として学習することができるようになった.その結果,2次元画像例から物体を容易に学習すること,および困難な特徴抽出なしで3次元物体の認識とポーズ推定をすることが可能となった.本論文では,手法の提案と共に他の2次元照合的な手法との比較実験結果についても述べる.
著者
西村 拓一 向井 理朗 野崎 俊輔 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1563-1570, 1997-06-25
参考文献数
12
被引用文献数
60

我々は, 動作者にデータグロープ等の接触型センサやマーカーを装着させることなく, 人間の身振り手振りをとらえた動画像からのジェスチャ認識を試みている. ここでは, 時間差分画像から特徴を抽出しているが, 衣服・背景の変化や動作の軌跡変動に影響されやすいという問題点があった. そこで, 本論文では, 時間差分画像の2値化により変化領域を求めることで前者の問題に対処し, 更に低解像度の画像特徴を用いることで後者の問題を解決できることを示す. また, 複数人物を同時にとらえるために適したカメラを用いて, 低解像度の人物のジェスチャでも本手法によりロバストに認識可能であることを実証する.
著者
市川 徹子 松原 友子 原 武史 藤田 広志 遠藤 登喜子 岩瀬 拓士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.1, pp.348-352, 2004-01-01
参考文献数
15
被引用文献数
13

乳腺の集中を伴う構築の乱れ領域の検出手法を提案する.本手法の乳腺集中を伴う症例に対しての真陽性率は84% (37/44), 1画像当りの偽陽性数は1.8個(81/44)であり,提案する手法の原理的な有効性が確認できた.
著者
中嶋 秀治 永田 昌明 浅野 久子 阿部 匡伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.480-488, 2005-03-01
被引用文献数
1

音声合成において合成音を作るためには, 未登録語であってもそのアクセント型(アクセントの位置の情報)が必要となる.本論文では, Support Vector Machine (SVM)を使って単語の読みから未登録語のアクセント型を推定する三つの方法を提案し, 性能を比較する.第1の方法では, 未登録語の読みを構成する各モーラのトーンの高低をSVMを使って推定し, 得られたトーン変化の中で高いトーンから低いトーンへ下降する場所を探して, アクセント型を判定する.第2の方法では, 単語の長さごとに用意されたSVMを使って, 同じアクセント型をもつ単語の集合に未登録語を分類することによってアクセント型を判定する.第3の方法は, 第2の方法の変形版で, 第2の方法とは異なる方法で単語の読みとアクセント型を表現する.また, 単語の長さによらない単一のSVMを使う.未登録の日本人の姓名を対象にしたアクセント型の推定実験を行ったところ, 第2と第3の手法において決定木の精度を上回り, 最高精度で姓では86.1%, 名では96.0%という結果が得られた.また, 実際のWebのニュース記事に現れた未登録語を対象にした実験でも決定木を上回り, 姓では91%, 名では86%という高い精度が得られ, 本手法の有効性が確認された.
著者
廣瀬 通孝 小木 哲朗 石綿 昌平 山田 俊郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.888-896, 1998-05-25
参考文献数
7
被引用文献数
130

本論文では, 5面のスクリーンを有する多面型全天周ディスプレイCABINの設計, 試作ならびにその特性評価について述べる.このシステムの特徴としては, 利用者の体重を支えることができるように下面スクリーンに強化ガラスを用いていること, CG映像と実写映像の両方を投影できること等を挙げることができる.5面スクリーンを使用することによって, 映像を見渡す際の視野角を大きくとることができ, 更に画面から飛び出して見える3次元物体をいろいろな方向から見回す際の視点の移動可能領域が格段に大きくなることが期待できる.試作システムについてその領域の大きさを定量的に解析した結果, 5面のスクリーンの必要とされる領域が非常に大きいこと, スクリーン枚数の増加による視野角の増大が顕著なことなどが明らかになった.また, 生成された仮想空間の精度についても評価を行ったところ, 中央付近から全体を見渡すような場合には, かなり実空間に近い視空間が生成できていることを実験的に検証することができた.
著者
李 晃伸 河原 達也 堂下 修司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.1, pp.1-9, 1999-01-25
被引用文献数
80

大語彙連続音声認識のための効率の良い段階的 (2パス) 探索手法を提案する. 中間表現として従来広く用いられているN-best表現の一種である単語グラフ形式は, 単語単位で決定的に区分化するためにコンテクストに依存したマッチング長の変動を表現できず, 直前単語ごとに仮説を多重化する単語対近似に伴う処理量の増大が著しい. これに対して単語トレリスインデックスという形式を提案する. 仮説を多重化せずに, 第1パスのトレリスでビーム内に残った単語終端ノードのゆう度と対応する始端をすべて保存することで, 単語境界の存在範囲のあいまい性を保持する. 第2パスではこれを逆引きすることで探索空間の絞込みを行い, またヒューリスティックスコアとして用いることで, 大語彙においても高精度かつ効率の良い探索を実現する. 5000語の毎日新聞記事読上げタスクで評価を行った結果, 単語グラフ形式に比べて高精度であることが確かめられた. 更に仮説を多重化しない1-best近似を用いることで, メモリ効率を10倍以上改善しながら従来手法とほぼ同等の認識精度が得られた. 単語間音素環境依存性を考慮した最終的な単語認識精度は91.4%を達成した.
著者
ズデネク プロハースカ 伊藤 崇之 岡本 敏雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1150-1159, 1998-06-25
被引用文献数
17

表情認識において最も根本的な問題は, 顔画像から個人差にできるだけ左右されない表現の特徴を安定かつ自動的に抽出することである.本論文では, 表情認識のための特徴として, 顔表面上の特定領域内の動きに着目し, その自動的な抽出手法を提案する.また, 本手法で抽出される特徴の性質を示すと共に, その特徴を用いることにより自動化を考慮していない従来の手法とほぼ同等な認識率が達成されることを示す.分析の結果として「喜」, 「哀」, 「驚」, 「恐怖」, 「怒」の五つの表現パターンは「喜」, 「驚」と「哀」, 「恐怖」と「怒」の三つの分離容易なグループを形成することが明らかになった.
著者
山澤 一誠 八木 康史 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.698-707, 1996-05-25
被引用文献数
200

ロボットをナビゲーションするには, ロボットの周囲の環境がどのような状況にあるかをセンサ情報から知る必要がある. 本論文では, 双曲面ミラーを用いた全方位視覚系(HyperOmni Vision)を提案し, その特徴と, HyperOmni Visionを用いた視覚誘導方法について述べる. 従来の全方位視覚系では, 光学系の特性が中心射影でなかったため独自の視覚情報の獲得方法が必要だった. しかし双曲面ミラーを用いた全方位視覚系は, 全方位の視野をもち, かつ中心射影の光学的特性ももつため, 一般のカメラで直接とった画像などに変換できる. そのため処理に応じた画像に変換でき, 独自の手法だけでなく従来の画像処理技術も利用できる利点がある. ここではHyperOmni Visionの構成, 特徴と光学系の特性, またHyperOmni Visionを用いた移動ロボットシステムとそのロボットのテンプレートマッチングによる移動量推定, 障害物検出について報告する.
著者
峯松 信明 藤澤 友紀子 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.1865-1876, 1999-11-25
被引用文献数
17

日本人によって発声された英単語音声に対する(韻律的)自動評定を目的として,1)英単語音声からの強勢音節検出の自動化,2)提案する強勢音節検出手法に基づいた強勢/弱勢の「音響的適切さ」評定の自動化,について検討した.強勢音節検出においては,音節を単位としたHMMを構築し,その検出を試みた.その際,着目する音節の単語内位置情報/構造情報/コンテクスト情報を導入することでHMMの精度向上を図り,検出性能の改善について実験的に検討した.その結果,同一方言(本論文ではBritish)内では最もカテゴリー数を増やしたHMMにおいて最高平均検出率が得られ,本論文で検討したHMMの高精度化に対する有効性が示された.一方,強勢/弱勢に対する英語としての「音響的適切さ」評定では,強勢音節検出時における「スペクトル」「パワー」「ピッチ」「継続長」の各ゆう度に対する重み係数を変化させ,最高検出率を示す重み(最適重み)を算出し,日本人話者/母語話者間で比較した.その結果,日本人による英単語音声では,ピッチ重みを大きく,スペクトル重みを小さくすることにより検出率が向上するなど,母語話者による英単語音声には見られない傾向(発音上の癖)が観測され,提案手法の,発音能力評定手法としての有効性が示された.
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.11, pp.1657-1667, 2003-11-01
被引用文献数
1

本論文では,多重奏音響信号をクエリーとして多重奏音響信号から類似する音楽を探索する類似音楽探索法とその高速化手法を提案する.本類似音楽探索においては多重奏音響の類似性に基づいた探索を高速に行う必要がある.そこで,まず,多重奏において同時に発生する複数の音の有無に着目した2値多重音響特徴ベクトルを提案する.本特徴は多重奏音響信号の類似性に基づいた高速探索に適している.そして更に,本特徴を用いた探索における高速化手法を導入する.本手法は類似度行列のスパース化により探索空間を制限し,より高速な探索を行う.216曲の実験用音楽データベースを用いた探索実験では,例えば,楽曲単位の探索において,クエリーの長さが平均19秒のとき,スペクトル特徴を用いた場合に62.5%であった精度が,提案の2値多重音響特徴ベクトルを用いることにより89.3%にまで向上した.また,本高速化手法においては,精度をほとんど損なわずに,DP照合を用いたずらし照合法に比べ約1.6倍から18倍の高速化を達成した.