- 著者
-
徳久 雅人
村上 仁一
池原 悟
- 出版者
- 一般社団法人 言語処理学会
- 雑誌
- 自然言語処理 (ISSN:13407619)
- 巻号頁・発行日
- vol.14, no.3, pp.193-217, 2007-04-10 (Released:2011-03-01)
- 参考文献数
- 15
- 被引用文献数
-
2
4
信頼性の高い情緒タグ付きテキスト対話コーパスを実現することを狙い, 漫画の対話文を対象に, 登場人物の表情を参照する方法によって情緒タグを付与した. また, 得られた対話コーパスの信頼性を評価した. 通常, 言語表現と話者の情緒とは, 必ずしも直接的な対応関係を持つとは限らず, 多義の存在する場合が多いため, 対話文に内包された情緒を言語表現のみによって正しく判定することは難しい. この問題を解決するため, 既に, 音声の持つ言語外情報を活用する方法が試みられているが, 大量の音声データを収集することは容易ではない. そこで, 本稿では, 漫画に登場する人物の表情が持つ情報に着目し, タグ付与の信頼性向上を図った. 具体的には, 漫画「ちびまる子ちゃん」10冊の対話文 (29, 538文) を対象に, 1話につき2人のタグ付与作業者が一時的な「表情タグ」と「情緒タグ」を付与した後に, 正解とする表情タグと情緒タグを両者が協議して決定するという手順で, コーパスを構築した. 決定された正解の情緒タグは16, 635個となった. 評価結果によれば, 付与された一時的な情緒タグの作業者間での「一致率」は78%で, 音声情報を使用した場合 (81. 75%) と比べて遜色のない値を示していること, また, 最終的に決定した情緒タグに対する作業者以外の者による「同意率」は97%であることから, タグ付与の安定性が確認された. また, 得られたコーパスを「情緒表現性のある文末表現の抽出」に使用したところ, 3, 164件の文末表現が清緒の共起割合とともに抽出され, 自然で情緒的な文末表現が得られたことから, 本コーパスに対しての「言語表現と情緒の関係を分析する上での1つの有効性」が示された. 以上から, 情緒判定において, 漫画に登場する人物の表情は, 音声に匹敵する言語外情報を持つことが分かり, それを利用したタグ付与方法の信頼性が確認された.