著者
吉井 和輝 Eric Nichols 中野 幹生 青野 雅樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.4, pp.1-8, 2015-05-18

単語ベクトルは,統計的自然言語処理で利用しやすい分散意味表現として近年盛んに用いられるようになってきた.しかしながら,今まで主に英語で評価されてきたため,英語以外の言語での有効性は不明である.本研究では,単語の類推 (word analogy) と文完成 (sentence completion) の二つの評価タスクを用い,著名なオープンソースツールである word2vec (gensim の再実装) と GloVe を用いて構築した日本語単語ベクトルの評価を行った.単語の類推タスクでは,英語データで公表されている結果に近い結果を得たが,文完成のタスクでは,精度が大幅に減少した.本稿では,両タスクのエラー解析で明らかになった英語の単語ベクトルと日本語の単語ベクトルの性能差や,日本語特有の問題について調査した結果について述べる.
著者
峯松 信明 西村 多寿子 朝川 智 櫻庭 京子 齋藤 大輔
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.2007, no.75, pp.75-80, 2007-07-20
参考文献数
30
被引用文献数
3

一つの言語には通常数十種類の音素(phoneme)がある。しかし音素の音的実体は前後文脈(音素環境)などによって多様に変形し,異音(allophone)と呼ばれる。音素と比較して種類数も多く,より具体的な音的現象に対応している。しかし奇妙なことに,これら音的事象を記号を用いて記す場合,性別,年齢,収録・伝送機器特性などによる音の変形(非言語的要因による音響的変形)は一切無視される.その音響的変形が幾ら大きくても,である。音声認識の音響モデリングは,凡そ,異音に相当する音事象をtriphoneとしてモデル化しているが,「非言語的変形の無視」を実装するために,数万人の話者から,様々な環境で収録した音サンプル群を統計的にモデル化している。本稿では,「非言語的変形の無視」の実装は,集めることではなく,音事象間の差異を捉えることで可能となることを数学的に示し,極めて少数の話者の音声で,不特定話者音声認識が可能であることを示す。提案する枠組みでは,音的要素をモデル化するのではなく,音的差異に着眼し,差異を集めることで構成される全体的な音的構造をモデル化する。
著者
李 晃伸 河原 達也 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.49, pp.281-286, 2003-12-18
参考文献数
15
被引用文献数
7

音声認識システムにおいて,認識結果に対して事後確率などを用いて信頼度を付与することで,発話検証や対話管理などの音声アプリケーションにおいて認識誤りを考慮したより高度な処理を行うことができる.この単語の事後確率を用いた信頼度算出では,通常,認識処理(デコーディング)の結果得られた仮説群のゆう度をもとに計算されるが,十分な精度の確信度を得るためにはN-best候補で数百以上の大量の文仮説を求める必要があり,多くの計算量を必要とする.本研究では,2パストリートレリス探索に基づくデコーディングにおいて,探索中に得られる部分文仮説の尤度から単語の信頼度を簡易かつ高速に算出するアルゴリズムを提案する.後段パスのスタックデコーディングにおける単語仮説展開時に,その次単語仮説の集合およびそれぞれから展開される新たな仮説のヒューリスティックを含む尤度から,その展開単語の事後確率を計算する.通常のデコーディング処理に対して極めて少ない計算量で信頼度を計算できる.認識エンジンJuliusにおいて,N-best候補から事後確率を算出する従来手法との比較を行った結果,提案手法は大量のN-best候補を求める必要がないことから認識処理全体を非常に高速に行え,また信頼度の精度も,簡易な計算法ながらN-best候補を用いる手法と同等以上の信頼度を算出できることが示された.
著者
岩野 公司 関 高浩 古井 貞熙
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.46, pp.55-60, 2003-05-27
参考文献数
6

本論文では,韻律情報を利用した雑音に頑健な音声認識手法について述べる。韻律特徴量として,時間-ケプストラム平面のハフ変換から得られる対数基本周波数の傾き(△log F_0)と最大累積投票値を利用し,通常の音声認識で用いられる音響特徴量と結合して用いる.音韻と韻律の融合モデルは,音節単位のマルチストリームHMMで構築する.融合モデルの様々な雑音環境における頑健性を確認するため,不特定話者の連続数字発声を対象とした音声認識実験を行った.実験の結果,本手法によって様々な雑音環境において数字正解精度の改善が確認され,△log F_0と最大累積投票値が相補的に認識性能の向上に貢献することがわかった.また,基本周波数情報を音声認識に用いることで,雑音環境下における数字境界の推定精度が向上し,それによって,数字正解精度の改善と,頑健な挿入ぺナルティーの設定が実現されることが確認された.
著者
石井 直樹 平石 智宣 延澤 志保 斎藤 博昭 中西 正和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.31, pp.23-30, 2000-06-02
参考文献数
8

日本語略語を復元するシステムについて報告する。このシステムは、任意の日本語略語に対して、新聞記事コーパス中の語句および辞書中の語句のうちから、いくつかの復元規則を用いて、元の語になると考えられるものを順位を付けて出力するものである。復元規則として、「元の語が略語内の文字を全て、同じ順で含むこと」、「略語と元の語を構成する字種が等しいこと」、「元の語の文字数が略語を構成する字数の4倍以内であること」、「略語内の文字が元の語の中で不連続的に含まれていること」といったことを定めた。用いる復元規則の数を変えながら404の略語に対して実験を行い、7割以上の確からしさで復元に成功した。
著者
高橋 遼太 能勢 隆 伊藤 彰則
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.1, pp.1-6, 2015-05-18

本論文では,従来の HMM 音声合成において曖昧であったアクセントラベリング基準について検討を行い,合成音声への影響を調べる.具体的には,アクセント型の表現およびアクセント句境界の基準について検討する.アクセント型については,尾高型が 0 型とモーラ長型の 2 通りの表現があることに着目し,それらを用いた場合に合成音声の F0 がどのような影響を受けるかについて客観評価を行う.また,2 段階クラスタリングを用いる効果についても検証する.アクセント句境界については,アクセント句によっては 0 型と 1 型の 2 つのアクセント句で表現する場合と,それらを結合し 1 つのアクセント句として表現する場合があり,これらの違いが合成音声に与える影響を調べる.またこれらの評価において,日本語アクセントの高低の誤りを客観的指標として導入し,この指標の有効性について分析を行う.
著者
平藤 燎 牧田 光晴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.7, pp.1-6, 2015-05-18

インターネット上のコミュニティサービスやソーシャルメディアのチャットログのような崩れた話し言葉テキストでは,形態素解析や固有表現抽出のような基礎的な処理が十分な精度で行えない.本研究ではこれらの基礎的タスクのうち,特に人名表現の抽出を従来より精度よく行う手法を提案する.まず会話のセッション内からヒューリスティクスを複数用いて人名表現候補を列挙する.これらを形態素解析時に辞書へ追加してから解析を行い,実際にその人名表現候補が選ばれた場合に人名表現と判定する.この方法により,既存の形態素解析器や固有表現抽出器では難しいあだ名や難読人名なども抽出できるようになり,Fisher's Randomization Test を用いた統計検定で 1% 水準で F-measure の改善が有意なことを確認した.
著者
岡谷 貴之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.11, 2015-05-18

一枚の画像からそこに写る物体の名前を答える物体カテゴリ認識は,コンピュータビジョンの長年の課題であったが,ディープラーニングの登場,正確には畳込みニューラルネットの 「再発見」 により大きく進展し,人の視覚と比肩するほどまでになった.一方,その他の多くの画像認識のタスク,例えば特定の物体を画像中で位置決めする 「物体検出」 や,人のポーズ認識,さらには動画像を使った人の行動認識に対しては,物体カテゴリ認識ほどはディープラーニングは成功していない.従来法を超えるという意味では一定の有効性が確認されているものの,これらのタスクでの性能は,人の視覚まではまだ相当の隔たりがある.また,物体カテゴリ認識あるいはその類似タスクに極めて高い精度を発揮する畳込みニューラルネットだが,なぜそんなに高い性能が出るのかの理解が追い付いていない.本講演では,この辺りの現状についてまとめ,今後を占うことを試みたい.
著者
吉本 暁文 新保 仁 原 一夫 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.5, pp.1-6, 2015-05-18

一般的に依存構造解析のアルゴリズムでは,句構造を扱わないために並列構造を考慮することが難しい.そこで,依存構造解析のための Eisner アルゴリズムを,並列構造解析ができるように拡張した.その規則の導出木は,既存の依存構造のアノテーションから導出することができる.
著者
鈴木 潤 永田 昌明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.16, pp.1-9, 2015-05-18

SkipGram, GloVe といった対数双線形言語モデルに属する単語分散表現のモデルは,これまで確率的勾配法 (SGD) やその拡張である AdaGrad といった勾配に基づくオンライン学習アルゴリズムを用いてパラメタ推定を行ってきた.しかし,対数双線形言語モデルと勾配に基づくパラメタ推定法の組み合わせは,解の収束性や再現性といった観点で,必ずしも適切な選択とは言えない.本稿では,より信頼性の高い単語分散表現を獲得する枠組みを構築することを目的として,対数双線形言語モデルが持つ性質に対応したパラメタ推定法を提案する.
著者
篠田 浩一 渡辺 隆夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.14, pp.75-81, 1996-12-12
参考文献数
10
被引用文献数
4

近年,隠れマルコフモデル(HMM)を用いた大語葉音声認識システムにおいて,コンテキスト依存サブワード単位がしばしば用いられてきた.その場合すべての認識単位のパラメータを十分な精度で学習するためには,一般に学習データ量が不足しているため,これらのシステムのほとんどは,モデルの自由度を下げるために様々な方法でパラメータのクラスタリングを行なっている.しかしながら,これらのクラスタリングの手法は停止基準を内包していなかった.本稿では,情報量基準の1つであるMDL基準を停止基準として用いる方法を提案する.評価実験の結果,提案法は少ない計算量で従来の発見的な方法と同等以上の性能をもつことが明らかになった.