著者
光本 浩士 濱崎 敏幸 大多和 寛 田村 進一 柳田 益造
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.5, pp.851-853, 2001-05-01

本論文は,話者の意図によって賞賛にも皮肉にもなり得る文の発話について,最終モーラである終助詞「ね」の韻律を用いて,賞賛発話か皮肉発話かの識別を試みている.3文,10人の138発話に対して,約76%の識別率が得られている.
著者
清木 康 金子 昌史 北川 高嗣
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J79-D2, no.4, pp.509-519, 1996-04-25

画像データを対象としたデータベースシステムにおいては,検索者の印象や画像の内容による検索を実現する方法が重要である.我々は,文脈あるいは状況に応じて動的に変化するデータ間の意味的な関係を計算するモデルである意味の数学モデルを提案している.本論文では,意味の数学モデルを用いた意味的画像探索方式を提案し,また,その学習機構を示す.本方式では,メタデータ空間と呼ぶ正規直交空間を形成し,その空間上に画像データ群,および,検索に用いるキーワード群を配置する.そして,その空間上での距離計算により,検索者の印象,および,画像の内容の指定に応じた画像探索を実現する.検索対象の各画像は,画像の特徴(印象あるいは内容)を表す言葉(単語群)によって表現されることを前提とする.本方式は,検索者が発行する検索語,および,画像データの特徴を表現する単語間の相関関係の分析により,画像を検索する方式として位置づけられる.本方式では,検索者が指定する印象あるいは画像の内容を文脈として言葉により与えると,その文脈に対応する画像をメタデータ空間より動的に抽出する.本学習機構では,その文脈から得られた画像が,本来,抽出されるべき画像と異なる場合,抽出されるべき画像を指定することにより,文脈を構成している言葉についての学習を行う.本学習機構を適用することにより,画像の印象表現における個人差に対応することが可能となる.
著者
若林 哲史 鶴岡 信治 木村 文隆 三宅 康二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.10, pp.2046-2053, 1994-10-25
被引用文献数
39

文字輪郭線の局所方向ヒストグラムを特徴量とする統計的手書き数字認識において,種々の方向量子化数と領域分割数の組合せに対して,大量の手書き数字データを用いた認識実験を行い,認識率および正規性との関係を調べた.また,より高い精度で方向量子化を行うために,濃度値こう配を利用する方向量子化の有効性を検討した.その結果,(1)特徴量の次元数を増加する場合,領域分割数は,4×4あるいは5×5程度とし,あとは方向量子化数を増加させるとよいこと,(2)同じ次元数では,正規性が良いほど認識率が高い傾向があること,(3)濃度値こう配を用いる方向量子化が,特徴量の正規性を保つのに有効であること,(4)量子化レべル数削減におけるフィルタ処理には,正規性を改善する効果があり,認識率の向上に有効であることなどがわかった.また,実際の郵便物から収集した郵便番号の手書き数字に対して,濃度値こう配の局所方向ヒストグラム(400次元)を用いた場合に,平均で正読率99.18%の良好な結果が得られた.
著者
五十嵐 治一 川人 光男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.6, pp.1104-1113, 1994-06-25
被引用文献数
5

視覚情報処理における光学の逆問題の解法として,標準正則化理論によるアプローチが有名である.しかし標準正則化理論ではエネルギー関数が2次形式に制限されており,正則化パラメータも経験的に定めているのが実情である.本論文では,こうした視覚情報処理における逆問題のみならず,一般的な逆問題の解法として2層確率場モデルを用いた一つの方法を提案する.2層確率場モデルでは,二つの確率場が階層構造をなしており,下層の確率場の状態が与えられたときに上層の確率場の状態の起こりやすさを表した条件付き確率によって緩やからに結合されている.本方法では,シミュレーテッドアニーリングによりエネルギー関数の最小状態を求めると共に,正則化パラメータなどのエネルギー関数中の重み係数の値を適切な値に自動調節することが可能である.例題として,原画像に関する正確なエッジ情報を用いて観測画像から原画像を復元する.2次元濃淡画像の修復問題を取り上げた.アニーリングによるエネルギー最小状態の探索処理と,エネルギー関数中の重み係数の調整アルゴリズムは,ともに並列化されており,SIMD型の並列計算機であるコネクションマシン(CM-2)を用いて大きな画像(128×64)を対象にすることが可能となった.計算機実験により,本論文で提案する逆問題の解法の正当性を検証することができた.
著者
坂野 鋭 武川 直樹 中村 太一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1549-1556, 2001-08-01
被引用文献数
36

本論文において我々は,新しい物体認識アルゴリズム,核非線形相互部分空間法を提案する.前田によって提案された相互部分空間法は複数の入力画像を主成分分析することにより,高度な物体認識を実現する優れた手法である.しかしながら,通常の部分空間法と同様,カテゴリーの分布が非線形構造をもつ場合には性能が低下するという問題がある.この問題を解決するために我々は強力な非線形主成分分析法として知られている核非線形主成分分析を相互部分空間法に適用し,新しい物体認識アルゴリズム,核非線形相互部分空間法を理論的に導出した.提案手法を顔画像による個人識別問題に適用したところ,最高精度では従来法と大きな差がつかなかったものの,提案手法を用いた実験では物体運動の自由度と高い認識率を示す部分空間次元数の関係が無矛盾に説明できることがわかった.また,提案手法では認識辞書がよりコンパクトな構造をとり,大規模認識問題に対して有効である可能性を示すことができた.
著者
清山 信正 今井 篤 三島 剛 都木 徹 宮坂 栄一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.918-926, 2001-06-01
被引用文献数
11

一般に高齢者にとって, 早口で話された音声が聞き取りにくいと感じられる場合がある.これを補償するため, 発声者の声の特徴を残したまま「ゆっくり」した音声に変換する話速変換技術の開発が進められている.一方, ビデオの早見や音声内容の検索を目的に早口に変換する試みもあり, それらの話速変換技術の一部は既に実用に供されている.また, マルチメディアの発展により, ハードディスク上に記録された映像・音声を可変速で再生する環境も整いつつある.同時にテキスト音声合成の高品質化に伴い, 音声波形の継続時間長を直接制御する技術としても, 高品質な話速変換技術が不可欠である.本論文では, 話速変換技術の広範な応用とその品質の自然性向上を目的として, 無声区間も含めた伸縮による話速変換方式を提案するとともに, 高齢者に対する音声放送サービス向上を目指した小型の話速変換器の開発について報告する.
著者
橘 高志 藤吉 正明 貴家 仁志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.850-859, 2004-03-01
被引用文献数
14

動画像へリアルタイムで透かしを埋め込むことを目的に,埋込みに伴う画質劣化を自動的に制限する画質保証型の電子透かし法を提案している.この提案法は,画像に依存せず常に所望の画質(PSNR)をもつ透かし画像の生成を可能とする.更に,透かし抽出時に原画像を必要としない非参照型電子透かし法の特徴も有する.従来の画質保証型電子透かし法では,透かし系列要素は実数値でありかつ正規分布に限定されるが,提案法ではこれらの制約は解除され,種々の統計分布をもつ透かし系列に適用可能である.また,提案法は,透かし系列を抽出することなく,埋め込んだ透かし系列の消去が可能であり,消去することによって画質を向上できる.シミュレーションでは,一様分布の2値系列を透かし系列として埋め込み,画質が保証されること,透かし系列の消去により画質が向上することを確認している.
著者
長谷山 美紀 金子 千晶 北島 秀夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.661-664, 2005-03-01
被引用文献数
1

リング周波数フィルタは, 高速かつ高精度に眉間の位置を検出できるが, 前髪を眉の近くまでおろしている人の顔に対しては, 適用ができない.本論文では, このような場合にも, 適用を可能とするためにフィルタの適用領域を限定する前処理を提案する.
著者
関口 芳廣 重永 実
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1522-1530, 1994-08-25
被引用文献数
4

連続音声は「なまけて」はっきり発声しない部分が随所にあり,文法的に重要な助詞などの認識も必ずしも正確にはできてないので,連続音声の認識には構文,意味等の言語情報に加え,人間と同様に,より直感的な情報,つまり連想情報の利用も必要である.この論文では,まず連続音声ではあいまいに発声される部分があり,その部分の音響処理が難しいことを示す.次に,人間がもっている単語間の連想関係を調査,検討して,音声認識で使用できる連想単語辞書を構築する.この連想単語辞書を利用して,単語間の連想の強さを求め,後続単語の予測を行う.また,句単位の認識の際,音響的な情報だけでなく,連想情報も加味している.実験の結果,筆者らの音声認識システムで75%以上の文認識率を得るためには,連想情報を利用しないと約90%以上の音素識別率が必要であったが,連想情報の利用により約80%の音素識別率で文認識率が75%以上になっている.また,筆者らの構築したシステムでは,認識のための得点付けには,音響情報と連想情報をほぼ3:1の割合で利用すればよいこともわかった.
著者
谷口 行信 外村 佳伸 浜田 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.4, pp.538-546, 1996-04-25
被引用文献数
79

本論文では, 映像をリアルタイムに解析することにより, ショットの切換わりを自動的に検出する新しい方法を提案する. ショットは映像の基本的な単位であり, 映像に対するアクセス, 編集, 検索などのインタフェースを実現する際に有用な情報である. 提案法は, 瞬時にショットを切り換えるカットだけでなく, フェードやワイプといったゆっくりとしたショット切換えも検出でき, 瞬間的なノイズや, 被写体の動きに対してもロバストであるという特徴をもつ. 提案法は, "隣り合う" フレームの間だけではなく, より間隔をおいた2枚のフレームの間で非類似度を計算し, それらを総合的に評価してショット切換えの判定を行う点が従来の方法とは異なる. 更に, 検出されたショット切換え情報に基づいて実現される映像アクセスインタフェースとしてPaperVideoとTVRamの二つを提案することによって, 本手法の有効性を示す.
著者
坂口 嘉之 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.11, pp.2210-2219, 1994-11-25
被引用文献数
12

人間が衣服を着て着飾って動く状況を作り出す仮想服飾環境(PARTY)における,衣服形状を計算するときに用いる,型紙と人体モデルとに適用する格子形成法について述べる.衣服の形状は,衣服を構成する布の物理特性と型紙形状,衣服をまとう人体形状とその動き,衣服の着方等さまざまな要因によって決まる.このために,解析的に衣服形状を算出することは困難であり,数値計算を行うことになる.衣服形状を数値計算するためには,まず,型紙と人体形状を格子に離散化した表現にする必要がある.更に,型紙は人体の展開図的な性質をもつために,この格子形成法は,基本的には型紙と人体とに共通して適用可能でなければならない.本論文では,滑らかさ,せん断変形,格子間距離からなる幾何学的制約を充足することによる格子形成法を提案する.計算実験により,型紙のダーツやプリーツ,縫合に対応できる本手法の柔軟性を示し,人体形状の格子形成では,あらかじめ設定した格子点数で人体形状を表現する.その結果,ほぼ満足できる格子が型紙と人体形状とに対して得られた.
著者
西本 卓也 志田 修利 小林 哲則 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2176-2183, 1996-12-25
被引用文献数
32

マルチモーダルインタフェースの枠組みの中で音声入力がどのようにインタフェースの改善に貢献し得るかを検討し,そこで得た知見を生かしたマルチモーダル作図システムS-tgifを作成・評価した.システムの作成にあたっては,インタフェースの原則論に従って音声の特長である操作性および手順連想容易性を生かし,欠点である状態理解容易性,頑健性を他で補うよう努めた.評価実験の結果,システムの利用を開始してまもない時期あるいは一時利用を中断した後などにおいては特に音声の利用効果が高く,課題の完了までに要する時間を約80%に減少できた.ユーザがシステムに熟練すると音声の利用の客観的効果は薄れるが,特定のコマンドでは音声の利用率が90%を超え,また主観評価の結果でも高い評価を得るなど,音声入力はユーザから支持された.このように,インタフェースの原則論に従って音声の効果的利用を考慮することにより,有用なインタフェースを構築できることが示された.
著者
木村 泰知 荒木 健治 桃内 佳雄 栃内 香次
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.9, pp.2079-2091, 2001-09-01

本論文では対話例から学習を行う音声対話処理手法について述べる.多くの音声対話システムはあらかじめ生成規則やデータベースを与えて処理を行うタスク指向であり,日常対話における雑談などの様々な話題を処理することは難しい.本手法はシステムとユーザのやりとりを対話例として,遺伝的アルゴリズムを用いた帰納的学習によってシステム応答とユーザ発話を対としたルールの獲得を行う.あらかじめ学習データを必要とせず,実対話例から獲得したルールにより応答を試みる.そのため,動的なデータから学習を行うことができ,データによる偏りを少なくする.本論文では本手法の有効性を明らかにするために,雑談を対象とし,音声対話に拡張したELIZA型システムと本手法によるシステムとの比較実験及び,複数被験者による実験を行った.その結果,比較実験で正応答と準応答の合計の割合が66.3%から76.1%に向上したことと,実対話例から獲得したルールを用いて有効な応答を行うことを確認した.この9.8ポイントの向上という結果は本手法が雑談に対して有効であることを示している.
著者
吉村 ミツ 村里 英樹 甲斐 民子 黒宮 明 横山 清子 八村 広三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.779-788, 2004-03-01
被引用文献数
24

本研究では,日本舞踊動作を解析して,舞踊家が師匠の技を模倣している程度,すなわち上達度を評価している.利用データは,赤外線追跡装置で取得した日本舞踊動作の3次元時系列である.筆者らの以前の研究では,このデータから注目動作部分を抽出するために,移動と回転に応じて動く3種類の動座標系を用いた.本研究ではその動座標系を改善した上で,移動,回転,向き補正,腰部揺動を同時に考慮した動座標系を考え,それを1回の変換で実現するアルゴリズムを考案している.筆者らは以前の研究で,舞踊家の上達度を客観的・定量的に表す指標として,動作の安定度と周波数特性に関する指標を定義した.本研究ではこれとは別の側面として,移動量に関する指標とガボール変換を利用したスペクトル成分の指標を定義している.ある流派の師匠と,その師匠から学んだ経験年数,性別が異なる4人の舞踊家,合わせて5人に舞踊実験を行ってもらい,注目動作の抽出と,その抽出結果を用いた指標の測定を行い,提案指標に基づいて上達度の評価を試みている.抽出が十分な精度で実現していて,指標が上達度や性による違いを表していることを確かめている.
著者
ツァガーン バイガルマ 清水 昭伸 小畑 秀文 宮川 国久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.140-148, 2002-01-01
被引用文献数
16

本論文では, 3次元可変形状モデルを用いた腹部CT像からの腎臓領域の抽出法を提案する.この方法は, 適当な位置に配置した初期モデルを連続的に変形させて目的の輪郭面を抽出するが, 今回は特に輪郭形状の平均やばらつき, 及び, 近傍の輪郭曲面との相関を考慮して変形を行う手法を提案する.具体的には, モデル曲面上の主曲率に注目し, その平均値と分散, 更に, 近傍の曲面との共分散を用いて変形する手法を開発した.本文では, 提案手法を実際の3次元腹部CT像からの腎臓領域抽出問題に適用した結果を示し, 本手法の有効性について議論する.
著者
村本 健一郎 松浦 弘毅 椎名 徹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.5, pp.949-958, 1993-05-25
被引用文献数
24

落下中の降雪雪片の形状を解析することは,雪片の生成メカニズムを解明する上で重要である.降雪雪片の形状を定量的に解析するためには,多くの雪片像より特徴量を抽出し,それらの相関を明らかにすることが必要である.本研究では,テレビカメラを使って,落下中の降雪雪片を連続的に撮影し,この2次元映像を画像処理して雪片の輪郭線を記録した.記録された輪郭データを用いて,落下中の雪片の運動に関与する雪片の領域の特徴解析と,雪片同士の併合に関与する輪郭線の複雑さとの2通りの解析を行った.領域の特徴解析では,面積,重心,落下姿勢および正規化モーメント特徴量を求めた.一方,輪郭線の複雑さとして,円形度,凹率およびフラクタル次元を計算し,これらの関係を調べた.モーメント特徴量,円形度,凹率は,面積や撮影方向により,影響を受けるが,フラクタル次元は,ほとんど一定値をとることがわかった.
著者
田中 正行 奥富 正敏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.11, pp.2200-2209, 2005-11-01
被引用文献数
21

複数の低解像度画像より一つの高解像度画像を復元する方法として超解像処理がある. 再構成型と分類される方法が広く利用されている. この再構成型超解像処理では, まず初期の高解像度画像を設定し, そこからカメラモデルに基づき観測画像である低解像度画像の各画素値を推定する. 推定された画素値と実際の観測画素値の誤差を最小にするように高解像度画像を更新する. 収束するまで更新処理を繰り返すことにより, 高解像度画像を求める手法が再構成型超解像処理である. 再構成型超解像処理は, 高解像度画像の画素の数だけの未知数があることや, 1回の更新につき複数の低解像度画像の総画素数分の画素値推定計算が必要であることなどから, 計算コストが大きい. 本論文では, 更新ごとに必要な計算コストを低減させることを目的とした高速化アルゴリズムを提案する. 提案手法は, 高解像度画像空間に離散化点とそれに対応する近傍領域を設定し, その近傍領域内に含まれる複数の観測画素値の平均値を利用し, その平均値と離散化点に対する推定画素値の誤差を最小にする方法である. ある近傍領域に対して, 従来法では近傍領域に含まれる観測画素の数の推定計算が必要であるが, 提案手法では1回の推定計算で済む. 合成画像及び実画像を使用した実験から, 提案手法は従来法と比較して約1.4〜8.5倍の高速化が確認できた. また, 推定精度は従来法とほぼ同程度であることも確認できた.
著者
大倉 計美 杉山 雅英 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2469-2476, 1993-12-25
参考文献数
17
被引用文献数
34

混合ガウス分布型HMMにおける話者適応方式である「移動ベクトル場平滑化話者適応方式」を提案する.本手法は,話者適応の問題を少量学習音声資料を用いたHMMの再学習による分布の移動問題としてとらえ,学習前後のHMMのガウス分布の平均ベクトルの差分(移動ベクトル)が構成する一つの場(移動ベクトル場)の連続性の拘束条件に基づく移動ベクトルの補間と平滑化により,不十分な学習資料しか得られない場合に生じる(1)未学習モデルの問題と,(2)モデルの推定誤差の問題,に対処するものである.本論文では評価話者に男女各1名を用いた23音素認識実験により,平滑化はモデルの推定誤差を吸収するために有効な手法であることを示した.また,文節音声認識において,本手法の発話様式適応への応用と不特定話者モデルに基づく話者適応への応用を検討し,本手法の有効性を示した.
著者
大西 正輝 村上 昌史 福永 邦雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.594-603, 2002-04-01
被引用文献数
42

本論文では,人手を介さずに板書主体の講義を自動的に撮影する手法として,講義の状況を理解することで撮影領域を決定し,得られた複数の映像を評価することで講義映像として最も適している映像にスイッチングを行う知的自動撮影手法を提案する.まず,講義の状況を理解するために,固定カメラによって撮影した講義映像から講義者と黒板の板書に関する情報を抽出し,それらの情報を用いて講義者の行動推定を行う.次に,講義者の行動に基づいて各カメラにおいて撮影領域を決定し,複数のカメラ位置から映像を取得する.最後に,得られた複数の映像をそれぞれ評価することにより,現在の講義状況を最も効果的に表している映像を選択する.実際に講義の自動撮影を行い,本手法の有効性を確認した.
著者
北岡 教英 赤堀 一郎 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.2, pp.500-508, 2000-02-25
被引用文献数
37

雑音環境下の音声認識の前処理として用いられる, パワースペクトル領域でのスペクトルサブトラクションでは, 音声と雑音の間の相関の影響で雑音除去が十分でないことが指摘されている.本論文では, 相関の影響を抑えるための方法として時間方向スムージングを提案する.これは, パワースペクトルの各成分ごとにスムージングを行うものであり, 統計的に相関の影響を小さく抑えることができる.更に, スムージングによる時間分解能の低下を防いでスムージングをより効果的に実現するために, 短い分析窓長で分析を行う方法を提案する.大語彙(い)単語認識実験により, 時間方向スムージング, 特に短い分析窓を用いた場合に有効であることを示す.また, 時間方向スムージングを用いたスペクトルサブトラクションに, 音響モデルを雑音付加音声で学習する雑音付加学習を併用した場合に, 更に認識率が向上することも示す.