著者
井上 中順 斉藤 辰彦 篠田 浩一 古井 貞煕
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2633-2644, 2010-12-01

本研究では,映像の中から「飛行機」や「歌っている人」といった高次特徴を検出するタスクに対し,SIFT特徴とMFCC特徴の混合ガウス分布(GMM)を用いた統計的手法を提案する.検出手法には,話者認識などで用いられてきたゆう度比による検出と,GMM Supervector SVM (GS-SVM)による検出の二つを用いる.ゆう度比による検出では,高次特徴が出現する部分としない部分のGMMをそれぞれ学習し,二つのモデルから得られるゆう度の比をもとに高次特徴を検出する.GS-SVMでは,各ショットに対するGMMを求め,GMM間の距離から定義されるRBFカーネルを用いたSVMで学習・識別を行う.最後に,各手法から対数ゆう度比を求め,その重み付き和により手法の融合を行う.TRECVID2009のデータセットを用いて評価実験を行った結果,Mean Average PrecisionはSIFT特徴とGS-SVMを用いた場合の0.141から,融合手法により0.173まで向上した.
著者
服部 一郎 熊谷 佳紀 大橋 剛介
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2678-2682, 2010-12-01

スケッチ画像検索において入力スケッチの各曲線情報とデータベースのエッジの各曲線情報をフーリエ記述子により記述し,データベース画像内に含まれるオブジェクトの部分検索を可能にする手法を提案する.
著者
佐野 徹 加東 勝 齊藤 貴樹 天野 英晴
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2579-2586, 2010-12-01

動的リコンフィギャラブルプロセッサにおいて,構成情報転送と実行のオーバラップができない際に,データ転送用の結合網を構成情報の転送に転用することで,構成情報転送時間を削減する手法,データバスコンフィギュレーションを提案する.動的リコンフィギャラブルプロセッサMuCCRA-3.32bを対象として,実際に設計及びシミュレーションを行った結果,データバスコンフィギュレーションの適用によってわずか1.3%のハードウェアオーバヘッドで,構成情報の転送時間を半分近くにすることができることが示された.f転送中の消費電力は増加するが,効率的な転送により消費エネルギーは2D-DCTの場合36%の削減が達成された.
著者
杉本 修 内藤 整 酒澤 茂之 羽鳥 好律
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2620-2632, 2010-12-01

Full Referenceフレームワークに基づくマルチメディアアプリケーション向けの知覚映像品質評価方式を提案する.本論文では,圧縮符号化による画質劣化に伴うユーザの知覚品質劣化の程度を七つの画像特徴量の重み付き和により定義された客観評価値により推定する.また,フレームレートに応じた客観評価値の補正を行うことにより,テレビ伝送用フォーマットのみを前提とした客観評価方式では対応できていなかった幅広い種類のアーチファクトをもつ低フレームレート画像に対する知覚映像品質の導出を可能としている.計算機シミュレーションにより提案方式の性能評価を行い,MPEG-4 part. 2及びH. 264/AVCエンコーダによりビットレート32 k~512 kbit/sで符号化した3~15 fpsのCIF,QCIF解像度の動画像の主観画質を相関0.88以上で推定可能であることを示す.また,上述のフレームレートに応じた客観評価値の補正により主観画質の推定精度を向上できること,及び7種の特徴量が等しく画質推定に寄与していることを示すことにより,提案方式が幅広い種類の映像に対応可能であることを示す.
著者
安田 宗樹 田中 和之
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.11, pp.2446-2453, 2010-11-01

ボルツマンマシンはマルコフ確率場の形式をとる確率的ニューラルネットワークの一つであり,パラメトリック機械学習の重要なモデルの一つである.しかしボルツマンマシンの厳密な学習アルゴリズムは一般にシステムの次元に対して指数的な計算コストを必要としてしまう.近年Hintonによりcontrastive divergenceと呼ばれる強力な近似学習アルゴリズムが提案され,多くの学習問題に適用されてきている.しかしながらcontrastive divergenceにはアルゴリズムの収束などに関しての理論的な保証がほとんどなく,実用的には確率的なサンプリング法を必要とするためアルゴリズムが分散をもってしまうという欠点がある.そこで本論文では相関等式と呼ばれる定式化を用いてボルツマンマシンに対する新しい近似学習アルゴリズムを提案する.提案学習アルゴリズムはボルツマンマシンの学習の問題を単純な凸最適化問題へと近似することにより得られる.そのアルゴリズムは観測データ点に対して決定論的に解を与えるものであるため実装には便利である.また提案学習アルゴリズムの性能はcontrastive divergenceやYasuda and Tanakaにより提案されたloopy belief propagationを用いた学習アルゴリズムの性能を多くの場合で上回ることを人工データに対する数値実験を用いて示す.
著者
藤田 和之 高嶋 和毅 築谷 喬之 朝日 元生 伊藤 雄一 北村 喜文 岸野 文郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.11, pp.2454-2465, 2010-11-01

ユーザによる単純な操作に複数のカメラ操作を連動させ,効率良く地図を閲覧することができるインタラクション手法としてAnchored Zoom (AZ)とAnchored Zoom and Tilt (AZT)の二つを提案する.二次元の地図を俯瞰する三次元的なカメラ視点を用い,AZではズームを,AZTではズームとチルトをパン操作に連動させ,ユーザの指定する地図上の1点を常にビューポートに収めるよう制御する.これら2手法のパフォーマンスを評価するため,ペン入力の環境において,従来手法であるPan & Zoom (PZ)及びSpeed-dependent Automatic Zooming (SDAZ)と比較する実験を行った.画面外オブジェクトの獲得タスクと位置把握タスクの二つを実施した結果,提案手法が従来手法に比べ距離感や方向感覚を失うことなく,より高速にオブジェクトを獲得できることが分かった.
著者
三留 綾 市毛 弘一 石井 六哉
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J89-D, no.6, pp.1369-1378, 2006-06-01

本論文では,人の直観性を伴った新たなユーザインタフェースとして,グローブやマーカ等の特殊な装置を必要としない簡単なハードウェア構成で手指形状を認識する手法を提案する.提案する認識手法は,手領域抽出部と手指形状認識部から構成される.手領域抽出部では,撮影する背景の制限を削減するために,背景がグレースケールの場合とカラーの場合の2パターンに分け,それぞれに対応したアルゴリズムにより手領域を抽出する.手指形状認識部では,抽出した手領域の画像を詳細に解析することにより,10種類の手指形状を認識する.入力する手の角度や腕の領域を制限せず,更に指同士が接している場合においても認識が可能になるようなアルゴリズムを提案する.提案手法により,背景がグレースケールの場合は10種類の手指形状を95.8%の精度で,背景がカラーの場合は同じく10種類の手指形状を93.3%の精度で認識している.また,これらの処理に要する時間は汎用コンピュータで数十 msであり,極めて短い時間であることを確認している.
著者
砂山 渡 川口 俊明 田村 幸寛
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.10, pp.2032-2041, 2010-10-01

近年のインターネットの普及につれ,大学などの教育機関において電子レポートを提出する機会が増えてきている.手書きのレポートであれば,人間が目で見て採点する必要があるが,電子的なデータとして存在するレポートであれば,そのレポート内の単語情報を計算機が自動的に取り出すことができるため,採点支援環境の構築により,人間の負荷を軽減することが期待できる.実験や演習のレポート課題においては,その課題に即したレポート提出者の意見が含まれている必要がある.しかし,レポートの独自性だけではなく,課題に関連して記述されている情報量を評価対象とする必要がある.そこで本研究では,レポートの情報量を,「レポートの課題に対する結果,及び結果に対する自分の意見の記述量」として定義し,これをもとにした客観的な各レポートの情報量を提示することで,レポート評価者がレポートの比較を行うことができるシステムを提案する.評価実験の結果,レポートの長さのみによらず,レポートの内容による評価を支援することができた.
著者
秋田 祐哉 三村 正人 河原 達也
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1736-1744, 2010-09-01

我々は国会審議の会議録作成支援を想定した音声認識システムの研究開発に取り組んでいる.会議録では原則として発話をすべて書き起こして記録することから,音声認識を活用する際には高い認識精度が求められる.このため,本研究では衆議院の審議音声からなるコーパスの整備を進めるとともに,これを用いた高精度の音響モデル・言語モデル・発音辞書の検討を行ってきた.音響モデルについては,種々の正規化手法に加えて最小音素誤り(MPE)学習を導入した.また言語モデルと発音辞書に関しては,話し言葉音声向けのモデルを生成するために発話スタイルの統計的変換手法を適用し,4-gram統計言語モデルと発音の変異形を含む辞書を構築した.これらのモデルに基づく音声認識システムについて実際の審議音声における評価を行ったところ,それぞれの手法が有効に機能していることが確認され,最終的には86%の文字正解精度が得られた.
著者
肥後 芳樹 宮崎 宏海 楠本 真二 井上 克郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1727-1735, 2010-09-01

これまでに様々なコードクローン検出手法が提案されているが,ギャップ(不一致部分)を含むコードクローンを検出できる手法は少ない.本論文では,ギャップを含むコードクローンを検出できないコードクローン検出手法の出力結果に対して後処理を行うことで,ギャップを含むコードクローン情報を生成する手法を提案する.提案手法は,グラフマイニングアルゴリズムの一つであるAGMアルゴリズムを用いており,効率的にギャップを含むコードクローン情報を生成することができる.提案手法を検出ツールCCFinderのポストプロセッサとして実装し,複数のオープンソースソフトウェアに対して適用したところ,多数の興味深いコードクローン情報を得ることができた.しかし,提示する必要がないと思われるコードクローンも生成してしまうことがあった.本論文では,この実験の結果について述べ,また,上記の問題に対する解決策についても考察する.
著者
伊藤 仁 伊藤 彰則
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1745-1754, 2010-09-01

音声信号を振幅と周波数が時間変化する正弦波成分の和として近似する正弦波モデルでは,非定常部でのパラメータ推定精度が問題となる.本論文では,音声信号の時間軸を第1調波成分の位相軸に置き換える時間軸変換と,正弦波成分の振幅と周波数の非定常性を単純な時変関数で近似する局所変化率変換に基づく正弦波パラメータ推定法を提案する.成人男女75名が発話した900個の単語音声を用いた性能評価実験により,提案法の推定精度を二つの既存手法と比較した.各手法の推定精度は,パラメータから再合成した信号に基づいて入力対残差パワー比(S/R)として定量化した.提案法の平均S/Rは28.4 dBで,時間軸変換を行わずパワースペクトルの局所ピークを用いるPeak-picking法(14.4 dB)や,正弦波成分の振幅の非定常性を考慮しないIF-attractor法(23.4 dB)より高かった.この推定精度の差は,特に入力音声の非定常性が高い場合に大きくなった.これらの結果から,非定常部を含む有声音声の正弦波パラメータの高精度推定において,時間軸変換と局所変化率変換を統合した提案法の有効性が確認された.
著者
張 憲栄 真田 英彦 手塚 慶一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J67-D, no.5, pp.599-606, 1984-05-25

活字のような非個性的文字ではなく,個性のある美しい文字による表現手段を,柔軟に且つ容易に可能にするために,漢字毛筆字体の計算機によるパターン合成を試み,一応満足すべき成果を得た.毛筆字体では筆触の形と大きさは運筆によって様々な変化があり,運筆は書道のきまりに従って,起筆,行筆,収筆などの変化がある.本方式は,(1)運筆に従って,形と大きさがコントロールされ,毛筆の動きを正確に捉えることのできる筆触を工夫し,(2)書道のきまりに従って異なった起筆,行筆,収筆などから成り,骨格関数および肉付け関数によって,行筆部が修飾できる画を考察し,すべての画を40余種類に分け,6乃至12のパラメータ,すなわち始点の座標,方向,長さ,太さ,曲度の入力により,画を発生するプログラムをそれぞれ作成しておき,(3)これらの画発生プログラムの組み合わせにより,趣味に合った毛筆漢字パターンを会話形式で合成するものである.本研究により勢いまで表現された漢字パターンの情報圧縮としては極限まで達成されたと考えられる.
著者
山口 暢彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.5, pp.632-641, 2010-05-01

近年,観測データの分布を潜在変数の非線形変換を用いて表現することにより,観測データの本質的な構造を探るGTM (Generative Topographic Mapping)が提案され,データの可視化やクラスタリング等への応用が行われている.しかしながら,GTMは独立同一分布からの標本を仮定しており,互いに相関をもつ時系列データに対してGTMを適用した場合,誤った結果を導きかねない.そこで本論文では,時系列データの生成モデルとして制約付きARHMM (Auto-Regressive Hidden Markov Model)を仮定するGTM-ARHMMの提案を行い,GTM-ARHMMを用いた時系列データの可視化手法について提案を行う.
著者
船越 孝太郎 木村 法幸 中野 幹生 岩橋 直人
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.5, pp.610-620, 2010-05-01

本論文では,少数の教示発話から,ユーザが任意に決めた物体や場所の名称をロボットが学習し識別するための手法を提案する.高齢者や児童も含めたユーザの使いやすさを高めるためには,語彙や言い回しに関する制限を課さないことが重要である.また,背景雑音などによって生じる誤認識に対して頑健でなければならない.そこで提案手法では,大語彙連続音声認識を用いて入力音声を認識し,複数の認識候補(N-best)に対しbag-of-wordsモデルに基づくトピック分類を適用することで,語彙や言い回しの制限を無くし,音声の誤認識に対して頑健な名称識別を可能にする.評価実験では,10の名称と六つの異なる言い回しを用いて16人分の音声発話を収集した.これらの音声発話を,雑音なし,雑音あり,雑音があり名称がすべて辞書に未登録,という三つの条件で音声認識し,その認識結果を用いて名称の学習と識別を行った.実験により,提案手法が言い回しの多様性や誤認識に対して頑健に名称を識別できることを確認した.分類手法としては,EMM,SVMV,LSAの3手法を比較し,LSAで最も良い結果を得た.また,N-bestからの頻度情報の抽出に関して,トークン計数法とタイプ計数法の二つの手法を比較し,我々の問題設定においてはタイプ計数法が適当であることを確認した.
著者
木本 晴夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J74-D1, no.8, pp.556-566, 1991-08-25

言語処理・知識処理・統計処理を用いる新しいキーワード自動抽出法として語特徴評価法を提案する.また,語特徴評価法に基づくキーワード自動抽出システム(INDEXERシステム)を作成し,評価を行ったのでその結果を報告する.本論文でのキーワード抽出の対象は日本語で書かれた新聞記事である.従来のキーワード自動抽出はフリーターム方式か統制キーワード方式を用いて行われていた.これらの方法では必要キーワードと共に,その3~5倍もの不必要キーワードが抽出されていた.語特徴評価法は,これらの不必要キーワードを大幅に削除して精度の高いキーワード自動抽出を実現することを目的としている.本方法はシステムが抽出したキーワード候補語について,個々の語の,文章中やシソーラスにおける特徴を抽出して,その特徴によって,キーワード候補語が文献の内容をよく代表していて,文献を検索するためのキーワード(以下では必要キーワードと呼ぶ,またシステムが自動抽出したキーワードで必要キーワードでないものを不必要キーワードと呼ぶ)として必要か否かを評価する方法である.ここで,語の特徴として次に掲げるものを採用している.それらは,並立に表現された語,連体修飾語,強調表現された語,シソーラスにおける上位語,シソーラスにおいて上位・下位の関係にある語,語の文章中における出現位置,出現頻度等である.語特徴評価法を用いることにより,抽出される不必要キーワードの数を従来の方法と比較して1/4にできることを実験によって確認した.更に,処理対象とする文書の分野特性を利用することによって,よりいっそうの精度向上が可能なことを述べる.またシステムが自動抽出したキーワードの相対的重要度を語の特徴を利用して評価した結果,上位の10語の中に専門家が付与したキーワードの95%を入れることができた.
著者
横山 正太朗 江口 浩二 大川 剛直
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.3, pp.180-188, 2010-03-01

近年ブログの利用が爆発的に増加しており,重要な情報源の一つになりつつある.ブログは,ハイパリンクを利用することで,参考にした情報を明示的に参照することが可能であり,このネットワークを対象にした研究が最近注目されつつある.しかし,こういった研究のほとんどが,リンク情報のみを対象にしており,本文の情報を参照していない.そこで本研究では,リンク構造だけでなく,本文のトピックを推定し,適切に情報伝搬をとらえる手段を確立することを目的とする.文書集合の潜在的なトピックを統計的に推定するのに用いられる確率的トピックモデルの代表的なものに,潜在的ディリクレ配分法(Latent Dirichlet Allocation:LDA)が挙げられ,広く用いられている.本研究では,このLDAを用いてポストのトピックを推定し,リンク間のトピック分布を比較することで,情報伝搬の単位(カスケード)を的確に抽出する枠組みを提案する.日本語ブログデータを用いた実験において,提案手法の有効性を示す.
著者
江口 浩二
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.3, pp.157-169, 2010-03-01

情報検索のための確率的言語モデルは1998年にPonteとCroftによって提案されてから,情報検索やそれに関連する課題に対する新たなアプローチとして注目を浴びてきた.その特徴の一つに,それまでに研究されてきたベクトル空間モデルや古典的確率型検索モデルで導入された発見的方法を極力用いず,数理的に説明可能な枠組みである点が挙げられる.その表現能力と柔軟性の高さにより,適用範囲は非構造なテキストデータに対する種々のタスクだけでなく,構造化文書検索やクロスメディア検索にも及ぶ.そこで,本論文では,情報検索のための確率的言語モデルの研究動向と将来課題について調査する.
著者
渡辺 賢 岩井 儀雄 八木 康史 谷内田 正彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J80-D2, no.10, pp.2713-2722, 1997-10-25

本論文では,単眼カメラから手を撮像し,得られた画像特徴量から指文字を認識するシステムの構築を目的とする.手のような関節物体は自由度が多く多彩な変形をするため,その形状を認識する際には,対応付け問題,オクルージョン問題などのさまざまな問題が発生する.そこで,本研究では撮像の際にカラーグローブを装着することにより,手の特定領域の検出を正確かつ容易にし,オクルージョンにも対処できる方法を提案する.また,実画像データをもとに計算機で生成したCAD理想モデルを用いた決定木の学習結果と,実画像を用いた学習結果の検証についても併せて紹介する.
著者
合田 和生 喜連川 優
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.3, pp.211-221, 2010-03-01

本論文では,グリーンレプリケーションと称し,業務継続を目的としたレプリケーションシステムにおける二次系ディスクストレージの省電力化方式を提案する.提案手法は,サービス復旧にかかる時間を意識した制御系のもとで,二次系に転送された更新情報をコンパクト化し,更新の反映操作を集中化することによって,ディスクドライブを長時間アイドル化する.商用データベースシステムを用いた実験により,30秒から100秒程度のサービス停止時間のオーバヘッドのもとで,二次系ディスクストレージの消費電力のうち80~85%を削減可能であることを示す.