著者
徳久 雅人 村上 仁一 池原 悟
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.14, no.3, pp.193-217, 2007-04-10 (Released:2011-03-01)
参考文献数
15
被引用文献数
2 4

信頼性の高い情緒タグ付きテキスト対話コーパスを実現することを狙い, 漫画の対話文を対象に, 登場人物の表情を参照する方法によって情緒タグを付与した. また, 得られた対話コーパスの信頼性を評価した. 通常, 言語表現と話者の情緒とは, 必ずしも直接的な対応関係を持つとは限らず, 多義の存在する場合が多いため, 対話文に内包された情緒を言語表現のみによって正しく判定することは難しい. この問題を解決するため, 既に, 音声の持つ言語外情報を活用する方法が試みられているが, 大量の音声データを収集することは容易ではない. そこで, 本稿では, 漫画に登場する人物の表情が持つ情報に着目し, タグ付与の信頼性向上を図った. 具体的には, 漫画「ちびまる子ちゃん」10冊の対話文 (29, 538文) を対象に, 1話につき2人のタグ付与作業者が一時的な「表情タグ」と「情緒タグ」を付与した後に, 正解とする表情タグと情緒タグを両者が協議して決定するという手順で, コーパスを構築した. 決定された正解の情緒タグは16, 635個となった. 評価結果によれば, 付与された一時的な情緒タグの作業者間での「一致率」は78%で, 音声情報を使用した場合 (81. 75%) と比べて遜色のない値を示していること, また, 最終的に決定した情緒タグに対する作業者以外の者による「同意率」は97%であることから, タグ付与の安定性が確認された. また, 得られたコーパスを「情緒表現性のある文末表現の抽出」に使用したところ, 3, 164件の文末表現が清緒の共起割合とともに抽出され, 自然で情緒的な文末表現が得られたことから, 本コーパスに対しての「言語表現と情緒の関係を分析する上での1つの有効性」が示された. 以上から, 情緒判定において, 漫画に登場する人物の表情は, 音声に匹敵する言語外情報を持つことが分かり, それを利用したタグ付与方法の信頼性が確認された.
著者
東田 正信 奥 雅博 村上 仁一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.10, pp.2249-2261, 2013-10-01

PB(プッシュボタン)電話機から利用者が検索条件を入力して電話番号を検索できる自動電話番号案内システムを開発した.検索キーワード入力には,情報機器に不慣れな利用者でも,簡単に操作方法を学習でき,短時間で入力できる文字情報縮退入力方式を採用した.本方式では,ひらがな5文字を一つの数字キーに縮退させて割り付けたPB電話機の数字キーを使い,検索キーワードをその「よみがな」に従って逐次数字キーを押下することで入力する.同様の文字割付に従い数字列化された情報を付加した電話帳DBを数字列化されたキーワードで検索する.本論文では,文字情報の縮退度情報を用いて利用者からの入力回数を最少化するための入力情報数最少化技術,採用した入力方式に起因する曖昧性を複数の曖昧さを含む情報の相互接続可能性を用いて解消する相乗的曖昧性解消技術などの知的対話誘導技術,及びこれらの技術を実装した自動電話番号案内システムの構築と評価について述べる.このシステムは「あんないジョーズ」という名称で公衆サービスとして提供された.1998年から2007年までのサービス期間中に,約1300万呼に対して検索処理を実行し,正しく電話番号を案内できた呼は約1000万呼であった.表示機能がないことによる入力内容のミスやキータッチのミスなどに起因して,番号が案内できなかった呼を除いて,「あんないジョーズ」が利用者に対してオペレータと同等の応対を提供できた呼の数は呼全体の約85%であった.
著者
村上 仁一
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日
vol.4, no.1, pp.48-56, 2010-07-01 (Released:2010-12-01)
参考文献数
9

現在,音声認識や統計翻訳などの多くの分野では,モデルのパラメータ推定にEM アルゴリズムがよく使われている.EMアルゴリズムは,確率モデルのパラメータを最ゆう法に基づいて推定する反復法の一種である.初期値を与えて,期待値ステップと最大化ステップを交互に繰り返す.音声認識においてはEM アルゴリズムの一つとして,Baum-Welch アルゴリズムがよく利用される.本論文では,このBaum-Welch アルゴリズムのステップバイステップの動作例を示して,このアルゴリズムの動作を説明する.最後にBaum-Welch アルゴリズムの他の分野への応用を紹介する.
著者
徳久 雅人 村上 仁一 池原 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.108, no.50, pp.41-46, 2008-05-16
被引用文献数
2

本稿では,テキスト対話から情緒を推定するための言語知識べースの構築を目指して,発話対と情緒の関係についての分析を行う.日本語の文末表現に情緒が表されやすいと言われているが,文末表現のみでは情緒を断定し難い.そこで,対話の状況を考慮に入れて情緒を推定する方法が考えられる.本稿では,対話の状況を発話対でとらえて情緒推定を行うことを目指す.その推定方式を検討するために,テキスト対話コーパスから,情緒タグ,対話行為タグ,および,文末表現パターンを発話対として抽出し,これらの共起関係を分析する.本コーパスから発話対を抽出したところ2.7万対が得られ,対話行為と文末表現の組に対して聞き手の情緒の傾向が確認できた.
著者
前田 浩佑 徳久 雅人 村上 仁一 池原 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.108, no.353, pp.19-24, 2008-12-06

本稿では,情緒傾向値の付けられた文末表現パターン辞書を用いることで,メール文章の口調のきつさを判定することを試みる.本辞書のパターンが文にマッチすることで,その文から解釈される情緒の傾向が解析される.そこで,口調(やわらかい・中立・きつい)を変えた3種類のメール文章を32名に作成してもらい,それらの各文章に対する情緒の傾向を,本辞書を用いて解析した.その結果,「やわらかい」および「中立」の口調で作成された文章と,「きつい」口調で作成された文章との間に,情緒傾向値の違いが見られ,それは,人間により口調の違いを識別する精度と同様の傾向であることが,実験的に確認された.こうして,本辞書を用いて,文章の口調のきつさを判定することの可能性が確認できた.
著者
村上 仁一 水澤 紀子 東田 正信
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.7, pp.1157-1165, 2002-07-01
被引用文献数
15

録音編集方式による音声合成において,可変部の単語件数が多い場合,必要な音声をすべて同一話者の音声で録音するのは困難である.本論文では,必要な単語の一部を同一話者の声で録音し,その音声波形から切り出した音節波形を信号処理をしないで接続することで,録音していない単語音声を合成する方法を検討した.本方式は,各音節の韻律的な情報として単語のモーラ数と音節の単語内モーラ位置を使用し,ピッチ周波数やパワーの定量的な分析や予測を行わないのが特徴である.日本の地名を合成対象として必要録音件数の調査を行ったところ,1万7千件の録音音声から4,5,6モーラ語の地名10万5千件が合成できることがわかった.また,地名を合成して聴覚実験を行ったところ,合成音声の品質も十分実用的なものであることがわかった.