著者
田中 宏季 柏岡 秀紀 キャンベル ニック
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.225, pp.49-54, 2011-09-29

我々は相手のパラ言語や笑いなど声によって変わる情報から,Engagementという次元で対話相手の興味レベルをセンシングし,自閉症児に視覚情報を含み伝達するシステムの開発を最終目標とする.コンピュータを用いたEngagement Sensingの初期段階として,人間の気持ちや意図が表出されやすいと考えられる笑い声に注目する.本稿では,笑いが4種類に分類されることを示し,その「笑い分類」を自閉症児がどの程度識別できるのか,また実際に自閉症児を指導している先生の笑いアノテーション結果を分析し,その音響特徴量について議論する.最後にSVMによるcloseでの自動識別を行い,58%の正解率を得た.
著者
松田 繁樹 林 輝昭 葦苅 豊 志賀 芳則 柏岡 秀紀 安田 圭志 大熊 英男 内山 将夫 隅田 英一郎 河井 恒 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.10, pp.2549-2561, 2013-10-01

本論文では,独立行政法人情報通信研究機構(NICT)が開発した世界初のスマートフォン用多言語音声翻訳アプリケーション"VoiceTra"を用いた大規模実証実験に関して,VoiceTraシステムの概要,クライアントサーバ間の通信プロトコル,本システムで用いられた多言語音声認識,多言語翻訳,多言語音声合成の詳細を述べる.また,本実証実験中に収集された約1000万の実利用音声データの一部について,聴取による利用形態の分析,更に,実験期間中に行った音声認識用音響モデル,言語モデルの教師無し適応,言語翻訳用辞書の追加に対する音声認識,音声翻訳性能の改善について述べる.
著者
木俵 豊 是津耕司 河合 由起子 水口充 宮森 恒 柏岡 秀紀
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.50, no.7, pp.613-623, 2009-07-15
被引用文献数
1

ライフログはユビキタスネットワーク・コンピューティング環境における新たな情報利活用技術の情報源となりつつある.ライフログは実世界におけるユーザの行動履歴を記憶の拡張として活用されている.ウェアラブルコンピュータを使って,ユーザの周りのさまざまな情報を取得する手法も提案されているが,このような情報は意図せぬ他人の情報を取得してしまうこともあり,プライバシの問題なども発生している.一方,ディジタルコンテンツを実世界で利用する場合の情報端末の操作や音声による発話および対話記録もライフログとして重要な情報源である.これらは,ユーザごとの興味に基づいた実世界のイベントや特徴を表現していることが多く,実世界アノテーション情報としても有益である.つまり,有効なライフログとして活用するためには,その情報の生成・発信,管理,分析,提示する技術開発が重要となる.本稿では,実世界におけるコンテンツ利活用に着目したライフログの活用について述べる.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1757-1764, 2004-09-01
参考文献数
11
被引用文献数
37

非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur:NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし.HMMを用いて認識するものである,これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い.HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い.NAM認識の実用可能性を検討した.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J87-D2, no.9, pp.1757-1764, 2004-09-01

「非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur: NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし,HMMを用いて認識するものである.これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い,HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い,NAM認識の実用可能性を検討した.
著者
丸山 岳彦 柏岡 秀紀 熊野 正 田中 英輝
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.11, no.3, pp.39-68, 2004-07-10 (Released:2011-03-01)
参考文献数
35
被引用文献数
6 11

従来の文分割研究において, 文の分割点として利用されてきたのは, 「節」の境界である. しかしながら, 実際に文の分割点として用いられる節境界はごく一部の種類のものに限られており, 文に含まれる節境界を網羅的に検出する手法は考えられてこなかった. 我々は, 日本語の文に含まれる節境界の位置を網羅的に検出し, その種類を特定するプログラム“CBAP (Clause Boundaries Annotation Program)”を開発した. CBAPは, 形態素解析の結果を入力とし, 局所的な形態素の連接を対象としたパタンマッチによって, 147種類の節境界を検出する. CBAPを性質の異なる5種のコーパスに適用したところ, いずれのコーパスでも97%以上の検出性能が確認された. この検出結果を利用することにより, 言語学的に意味のある文の分割点を特定することができ, 従来の手法よりも柔軟に文分割を行なうことができる. また, 1~3形態素という非常に局所的な範囲のみから節境界を検出できるため, 発話に追従して処理を進めていく漸進的構文解析や同時通訳システム, また, 句点を含まない音声コーパスを対象とした発話分割処理などに有用である. 本稿では, CBAPによる節境界の検出手法を示し, 節境界を用いて文分割・発話分割処理を行なった事例をもとに, 節境界検出の有用性を述べる.
著者
翠 輝久 大竹 清敬 堀 智織 河井 恒 柏岡 秀紀 中村 哲
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2011, no.10, pp.1-6, 2011-07-14

ユーザがシステムから情報提示を受けながら候補を選択する意志決定型の音声対話システム構築と被験者実験の結果を報告する.これまで我々は,意志決定対話を部分観測マルコフ過程 (POMDP) としてモデル化し,ユーザの意志決定の良さを最大化するための対話戦略の最適化を行ってきた.本稿では,提案モデルを用いた対話制御手法と複数のベースライン手法とを被験者実験により評価した結果を報告し,ユーザシミュレーション環境で有効性を確認した提案手法が,実ユーザを対象とした場合でも有効であることを示す.This paper presents the results of the user evaluation of spoken decision support dialogue systems, which help users select from a set of alternatives. Thus far, we have modeled this decision support dialogue as a partially observable Markov decision process (POMDP), and optimized its dialogue strategy to maximize the value of the user's decision. In this paper, we present a comparative evaluation of the optimized dialogue strategy with several baseline strategies, and demonstrate that the optimized dialogue strategy that was effective in user simulation experiments works well in an evaluation by real users.
著者
キヤンベル ニツク 定延 利之 柏岡 秀紀
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(B)
巻号頁・発行日
2007

本研究のはじめに「対話構造」、「アクティブ・リスニング」を主なテーマとして、招待講演や国内および国際会議での発表を多く行った。本プロジェクトにより、新たな技術を得てはいないが、自然音声対話に関しての合成と認識手法に関して理解を深めることが可能となった。また本研究はEUのプロジェクトであるSocial Signal Processingに影響を及ぼした。さらに大規模マルチモーダルコーパスを数カ国の大学と協力して収録し、ウェブページhttp://www.speech-data.jp/nick/mmx/d64.htmlにそのデータベースを掲載した。最後に本研究で開発された画像処理モジュール、音声処理モジュールを含み、簡単な会話が可能なロボット"Herme"を完成させた。"Herme"は現在アイルランドに展示されており、ロボットとの対話音声コーパスの収録を行っている。