著者
三留 綾 市毛 弘一 石井 六哉
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J89-D, no.6, pp.1369-1378, 2006-06-01

本論文では,人の直観性を伴った新たなユーザインタフェースとして,グローブやマーカ等の特殊な装置を必要としない簡単なハードウェア構成で手指形状を認識する手法を提案する.提案する認識手法は,手領域抽出部と手指形状認識部から構成される.手領域抽出部では,撮影する背景の制限を削減するために,背景がグレースケールの場合とカラーの場合の2パターンに分け,それぞれに対応したアルゴリズムにより手領域を抽出する.手指形状認識部では,抽出した手領域の画像を詳細に解析することにより,10種類の手指形状を認識する.入力する手の角度や腕の領域を制限せず,更に指同士が接している場合においても認識が可能になるようなアルゴリズムを提案する.提案手法により,背景がグレースケールの場合は10種類の手指形状を95.8%の精度で,背景がカラーの場合は同じく10種類の手指形状を93.3%の精度で認識している.また,これらの処理に要する時間は汎用コンピュータで数十 msであり,極めて短い時間であることを確認している.
著者
吉岡 泰智 渡辺 俊典 古賀 久志 横山 貴紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.90, no.1, pp.83-93, 2007-01-01
被引用文献数
1

ビデオの内容を自動認識する技術は,監視,圧縮,要約など応用範囲が広い.認識対象を想定してそのモデルを人手や学習によって事前準備しておくというのが伝統的画像認識手法であるが,事前に想定できない多様な内容を含み,かつデータ量も膨大なビデオには十分対応できない.対策として,事前のモデル設定なしにビデオを観測しながらモデルの獲得と認識とを行う機構が望まれる.更にリプレイ時間や記憶のコストを削減するためにはワンパスで実時間性を備えたオンラインリアルタイム処理が理想である.本論文では,このような機能を備えたビデオ内動作オブジェクト自動認識システムを提案する.人の行動を撮影したビデオのみを与えて,歩く,座る,などの基本動作の獲得と認識とが完全自動で行えることを示す.
著者
砂山 渡 川口 俊明 田村 幸寛
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.10, pp.2032-2041, 2010-10-01

近年のインターネットの普及につれ,大学などの教育機関において電子レポートを提出する機会が増えてきている.手書きのレポートであれば,人間が目で見て採点する必要があるが,電子的なデータとして存在するレポートであれば,そのレポート内の単語情報を計算機が自動的に取り出すことができるため,採点支援環境の構築により,人間の負荷を軽減することが期待できる.実験や演習のレポート課題においては,その課題に即したレポート提出者の意見が含まれている必要がある.しかし,レポートの独自性だけではなく,課題に関連して記述されている情報量を評価対象とする必要がある.そこで本研究では,レポートの情報量を,「レポートの課題に対する結果,及び結果に対する自分の意見の記述量」として定義し,これをもとにした客観的な各レポートの情報量を提示することで,レポート評価者がレポートの比較を行うことができるシステムを提案する.評価実験の結果,レポートの長さのみによらず,レポートの内容による評価を支援することができた.
著者
秋田 祐哉 三村 正人 河原 達也
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1736-1744, 2010-09-01

我々は国会審議の会議録作成支援を想定した音声認識システムの研究開発に取り組んでいる.会議録では原則として発話をすべて書き起こして記録することから,音声認識を活用する際には高い認識精度が求められる.このため,本研究では衆議院の審議音声からなるコーパスの整備を進めるとともに,これを用いた高精度の音響モデル・言語モデル・発音辞書の検討を行ってきた.音響モデルについては,種々の正規化手法に加えて最小音素誤り(MPE)学習を導入した.また言語モデルと発音辞書に関しては,話し言葉音声向けのモデルを生成するために発話スタイルの統計的変換手法を適用し,4-gram統計言語モデルと発音の変異形を含む辞書を構築した.これらのモデルに基づく音声認識システムについて実際の審議音声における評価を行ったところ,それぞれの手法が有効に機能していることが確認され,最終的には86%の文字正解精度が得られた.
著者
肥後 芳樹 宮崎 宏海 楠本 真二 井上 克郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1727-1735, 2010-09-01

これまでに様々なコードクローン検出手法が提案されているが,ギャップ(不一致部分)を含むコードクローンを検出できる手法は少ない.本論文では,ギャップを含むコードクローンを検出できないコードクローン検出手法の出力結果に対して後処理を行うことで,ギャップを含むコードクローン情報を生成する手法を提案する.提案手法は,グラフマイニングアルゴリズムの一つであるAGMアルゴリズムを用いており,効率的にギャップを含むコードクローン情報を生成することができる.提案手法を検出ツールCCFinderのポストプロセッサとして実装し,複数のオープンソースソフトウェアに対して適用したところ,多数の興味深いコードクローン情報を得ることができた.しかし,提示する必要がないと思われるコードクローンも生成してしまうことがあった.本論文では,この実験の結果について述べ,また,上記の問題に対する解決策についても考察する.
著者
伊藤 仁 伊藤 彰則
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.9, pp.1745-1754, 2010-09-01

音声信号を振幅と周波数が時間変化する正弦波成分の和として近似する正弦波モデルでは,非定常部でのパラメータ推定精度が問題となる.本論文では,音声信号の時間軸を第1調波成分の位相軸に置き換える時間軸変換と,正弦波成分の振幅と周波数の非定常性を単純な時変関数で近似する局所変化率変換に基づく正弦波パラメータ推定法を提案する.成人男女75名が発話した900個の単語音声を用いた性能評価実験により,提案法の推定精度を二つの既存手法と比較した.各手法の推定精度は,パラメータから再合成した信号に基づいて入力対残差パワー比(S/R)として定量化した.提案法の平均S/Rは28.4 dBで,時間軸変換を行わずパワースペクトルの局所ピークを用いるPeak-picking法(14.4 dB)や,正弦波成分の振幅の非定常性を考慮しないIF-attractor法(23.4 dB)より高かった.この推定精度の差は,特に入力音声の非定常性が高い場合に大きくなった.これらの結果から,非定常部を含む有声音声の正弦波パラメータの高精度推定において,時間軸変換と局所変化率変換を統合した提案法の有効性が確認された.
著者
飯島 裕一 石川 佳治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.781-794, 2010-06-01

移動ロボットやモバイルセンサネットワークなどの位置情報を利用したアプリケーションでは,最近傍問合せは重要な問合せとして位置づけられている.しかし,制御ノイズや測定誤差などの理由により問合せを行うオブジェクトの位置があいまいな位置情報としてしか得ることができない場合が存在する.そのため,位置のあいまい性を考慮した問合せ処理手法が必要とされている.そこで本論文では,問合せを行うオブジェクトの位置が正規分布の確率密度関数によってあいまいな位置情報として表現されている状況における最近傍問合せの処理手法を提案する.まず通常の最近傍問合せを拡張した確率的最近傍問合せを定義し,この問合せを効率的に処理するための戦略として二つの問合せ戦略を提案する.どちらの戦略も,問合せの対象となるオブジェクトの集合から明らかに問合せを満たさないといえるものを求めることで計算コストの削減を図るが,その方法が異なっている.これら二つの戦略にそれらのハイブリッド方式の戦略を加えた三つの戦略に対して,実験によって性能の比較を行った結果についても報告する.
著者
原田 達也 中山 英樹 國吉 康夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.857-869, 2010-06-01

本論文では実世界でユーザの見たものを瞬時に記述・蓄積し,後で言葉を用いて検索可能とするAI Gogglesを提案する.これは,カメラを備えたゴーグル,タブレット型計算機とHead Mount Displayからなるウェアラブルシステムである.本システムは以下の五つの機能を特徴とする. (1)高速かつ高精度な画像アノテーション・リトリーバル機能, (2)画像の大域的な情報から画像に写る対象を推論する機能, (3)安定かつ高速な追加学習機能, (4)常にデータが増え続ける状況に対応可能な機能, (5)意味に基づいた特徴抽出を行える機能.標準的なデータセットを用いた実験では,本手法が精度の面で2008年度の最良手法と同等の性能を示し,計算速度では上回ることを示した.更に,屋内と屋外の双方における実験を実施し,提案システムは統制困難な環境において予測できない認識対象の追加に対応可能であり,安定して動作することを確認した.
著者
塩川 浩昭 北川 博之 川島 英之 渡辺 陽介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.767-780, 2010-06-01
被引用文献数
2

近年,実世界から得られるストリームデータに対する問合せ要求が増大し,それらを実現するストリーム処理システムが研究開発されてきた.そして,地理的に離れた情報源の統合や負荷分散を実現させるために,ストリーム処理システムを分散配置させて利用する分散ストリーム処理システムが注目されている.分散ストリーム処理システムでは,複数のストリーム処理システムの入力と出力をつなぎ合わせることにより分散環境を構築するため,分散配置されたノートが一つでも停止してしまうと,システム全体が停止してしまうという問題がある.この問題を解決するため,本論文では,分散環境において高信頼化を実現するSemi-Active Standby方式を提案する.本方式は,既存方式であるActive Standby方式,Upstream Backup方式を統一化した方式であり,高信頼化におけるリカバリ時間とバンド幅使用率の調整を可能にする.本論文では,Semi-Active Standby方式の動作特性の詳細について述べる.また,我々が開発したプロトタイプシステムで行った評価実験について述べる.
著者
高橋 和哉 中村 勝一 山崎 克之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.1065-1066, 2010-06-01

超音波測距センサを用いた人群観測ネットワークを設計・実装した.人検出時間率の考え方により人群観測を実現し,計算時間も実用上問題ないことを実証することで,コストやプライバシーの課題を解決した人群観測の実用性を示した.
著者
石田 亨 村上 陽平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.675-682, 2010-06-01
被引用文献数
1

Wikipediaなどの集合知を形成する取組みが,Web上での知識の集積に大きく寄与し始めている.現在進んでいる集合知の形成が,文章,写真,動画などを組み上げていくコンテンツ指向の集合知であるのに対し,本論文で扱うのはサービスを組み上げるサービス指向の集合知である.サービス指向の集合知は,これまでもいくつか試みられているが,Wikipediaのような典型的な成功例はまだ現れていない.本論文ではWebサービスを要素として集合知を形成する枠組みをサービスグリッドと呼び,大学や研究機関などの非営利組織を中心とする公共的なサービスグリッドの制度設計を試みる.特に,サービス提供者,サービス利用者,サービスグリッド運営者という3種のステークホルダーの立場から,それぞれ(1)知的財産権,(2)応用システム,(3)連邦制運営について議論を深める.
著者
市岡 健一 福本 文代
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.3, pp.428-438, 2009-03-01
被引用文献数
1

本論文では,意味的に類似したオノマトペを自動的に分類する手法を提案する.本手法は「Web上からのオノマトペ間の共起頻度取得」,「オノマトペ間の類似度算出」,「音象徴の適用」,「オノマトペのクラスタリング」という四つの処理からなる.各々の処理において,「AND検索とPhrase検索」,「χ^2値と相互情報量」,「音象徴の適用の有無」,「Newman法とSpectral Clustering」を導入し,どのような手法の組合せがオノマトペの自動分類に有効かを検証した. 10種類のクラスに分類される292語のオノマトペに対して分類を行った結果,「Phrase検索,相互情報量,音象徴の適用有, Newman法」という手法の組合せで,最も良い結果(F値で0.421)が得られた.また, Spectral ClusteringはAND検索やχ^2値によるノイズに弱い,ということが明らかになった.
著者
伊藤 暁 井上 克司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.89, no.2, pp.399-400, 2006-02-01
被引用文献数
1

ドント方式がO(n)時間で計算できることを示す.ここに,nは選挙に参加する政党数であり,一様コスト基準のもとで入力データサイズに比例する.
著者
安田 浩志 齋藤 豪 中嶋 正之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.2, pp.255-261, 2009-02-01

工業製品の評価及び映画を含むエンターテイメント分野において,実際の人間による実現が困難な場面でのシミュレーションを行うため,計算機上で人体機構を再現する手法への需要が高まっている.本論文では特に人体のもつ機構特性の一つである関節可動域に注目し,簡略化された球関節人体モデルにおいて関節可動域のもつ解剖学的特性を再現する手法を提案する.多関節筋による影響から,一部の関節可動域は完全に独立ではなく隣接する関節の状態に大きく影響を受ける.しかし,関節ごとを独立に扱う従来の可動域表現ではこの変化を再現することができない.提案手法では,モーションキャプチャ装置を用いて混合正規分布による確率密度関数として関節可動域を決定する.まず,自己組織化マップにより非均一である計測データからの安定した関節可動域推定を実現し,次に正規分布間の共起関係により,複雑な筋骨格モデルを用いることなく多関節筋による影響の近似を可能にした.
著者
相良 毅 喜連川 優
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.3, pp.531-537, 2008-03-01
被引用文献数
1

Webからの店舗情報収集を行う際には,収集したWebページがある店舗に関連することを確認するため,店舗名称を識別語として利用する必要がある.しかし,店舗データベースに登録されている店舗名称には,支店名などWebページには記載されていない可能性のある語(不要語)が含まれているため,収集したページを正しく関連づけられないという問題がある.不要語にはビル名を用いた支店名など多くのバリエーションがあり,不要語辞書を整備して除去することは難しい,そこで,店舗データベースに含まれる住所の情報や,周辺の駅名,同じ住所に存在する複数の店舗名称を用いることにより,店舗名称をクリーニングする手法を開発した.実験によると,提案手法のクリーニング正解率は95.3%と実用的な性能を示した.
著者
山口 暢彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.5, pp.632-641, 2010-05-01

近年,観測データの分布を潜在変数の非線形変換を用いて表現することにより,観測データの本質的な構造を探るGTM (Generative Topographic Mapping)が提案され,データの可視化やクラスタリング等への応用が行われている.しかしながら,GTMは独立同一分布からの標本を仮定しており,互いに相関をもつ時系列データに対してGTMを適用した場合,誤った結果を導きかねない.そこで本論文では,時系列データの生成モデルとして制約付きARHMM (Auto-Regressive Hidden Markov Model)を仮定するGTM-ARHMMの提案を行い,GTM-ARHMMを用いた時系列データの可視化手法について提案を行う.
著者
船越 孝太郎 木村 法幸 中野 幹生 岩橋 直人
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.5, pp.610-620, 2010-05-01

本論文では,少数の教示発話から,ユーザが任意に決めた物体や場所の名称をロボットが学習し識別するための手法を提案する.高齢者や児童も含めたユーザの使いやすさを高めるためには,語彙や言い回しに関する制限を課さないことが重要である.また,背景雑音などによって生じる誤認識に対して頑健でなければならない.そこで提案手法では,大語彙連続音声認識を用いて入力音声を認識し,複数の認識候補(N-best)に対しbag-of-wordsモデルに基づくトピック分類を適用することで,語彙や言い回しの制限を無くし,音声の誤認識に対して頑健な名称識別を可能にする.評価実験では,10の名称と六つの異なる言い回しを用いて16人分の音声発話を収集した.これらの音声発話を,雑音なし,雑音あり,雑音があり名称がすべて辞書に未登録,という三つの条件で音声認識し,その認識結果を用いて名称の学習と識別を行った.実験により,提案手法が言い回しの多様性や誤認識に対して頑健に名称を識別できることを確認した.分類手法としては,EMM,SVMV,LSAの3手法を比較し,LSAで最も良い結果を得た.また,N-bestからの頻度情報の抽出に関して,トークン計数法とタイプ計数法の二つの手法を比較し,我々の問題設定においてはタイプ計数法が適当であることを確認した.
著者
横山 正太朗 江口 浩二 大川 剛直
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.3, pp.180-188, 2010-03-01

近年ブログの利用が爆発的に増加しており,重要な情報源の一つになりつつある.ブログは,ハイパリンクを利用することで,参考にした情報を明示的に参照することが可能であり,このネットワークを対象にした研究が最近注目されつつある.しかし,こういった研究のほとんどが,リンク情報のみを対象にしており,本文の情報を参照していない.そこで本研究では,リンク構造だけでなく,本文のトピックを推定し,適切に情報伝搬をとらえる手段を確立することを目的とする.文書集合の潜在的なトピックを統計的に推定するのに用いられる確率的トピックモデルの代表的なものに,潜在的ディリクレ配分法(Latent Dirichlet Allocation:LDA)が挙げられ,広く用いられている.本研究では,このLDAを用いてポストのトピックを推定し,リンク間のトピック分布を比較することで,情報伝搬の単位(カスケード)を的確に抽出する枠組みを提案する.日本語ブログデータを用いた実験において,提案手法の有効性を示す.
著者
江口 浩二
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.3, pp.157-169, 2010-03-01

情報検索のための確率的言語モデルは1998年にPonteとCroftによって提案されてから,情報検索やそれに関連する課題に対する新たなアプローチとして注目を浴びてきた.その特徴の一つに,それまでに研究されてきたベクトル空間モデルや古典的確率型検索モデルで導入された発見的方法を極力用いず,数理的に説明可能な枠組みである点が挙げられる.その表現能力と柔軟性の高さにより,適用範囲は非構造なテキストデータに対する種々のタスクだけでなく,構造化文書検索やクロスメディア検索にも及ぶ.そこで,本論文では,情報検索のための確率的言語モデルの研究動向と将来課題について調査する.