- 著者
-
熊本 忠彦
伊藤 昭
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告情報学基礎(FI)
- 巻号頁・発行日
- vol.1997, no.86, pp.31-36, 1997-09-11
- 参考文献数
- 10
近年,話し言葉を対象とする自然言語処理の分野において対話コーパスを利用した研究が盛んに行われている.しかしながら,従来利用されている対話データは,模擬的な実験環境において収集された対話 (模擬対話) であり,実際の状況下で得られるであろう対話 (実対話) と言語的・対話的性質が同じであるとは限らない.そこで,我々は,模擬対話と実対話の定性的,定量的な共通点/相違点を明らかにするための材料として,2つの対話領域において模擬対話と実対話をそれぞれ収集した.本稿では模擬対話と実対話を規定する要因について考察し,実対話を収集するための実験環境を設計する.また,この設計に基づいて実際に行った実対話収集実験についても述べる.In recent years various kinds of dialogue corpora have been constructed and used for studies on dialogue and spoken language. In conventional dialogue collection, however, systematically collecting a large amount of dialogues and constructing a very large corpus are considered critically important, while the spontaneity of the dialogues collected is not a point to be carefully considered. "Spontaneous dialogue" does not mean that the dialogue itself is spontaneous but means that an utterance in the dialogue is spontaneous. However, it is obvious that the spontaneity of a dialogue determines the structure and aspect of the dialogue. Therefore, in this article, we consider the spontaneity of a dialogue and propose a method for collecting spontaneous dialogues in an experimental environment. We also describe the two kinds of experiments which we actually conducted for collecting spontaneous dialogues.