- 著者
-
小磯 花絵
前川 喜久雄
- 雑誌
- 情報処理学会研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.2001, no.54(2001-NL-143), pp.41-48, 2001-05-31
国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度の下,自発性の高い話し言葉の情報処理技術の確立を目標に活動を進めている.現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している.このコーパスには,約700時間の音声(約700万形態素に相当),書き起こしテキスト,および形態素などの情報が含まれる予定である.本稿では,本コーパスの設計の概要および書き起こし基準の詳細について紹介する.