著者
永田 亮 河合 綾子 須田 幸次 掛川 淳一 森広 浩一郎
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.17, no.2, pp.2_51-2_65, 2010 (Released:2011-06-23)
参考文献数
22

自然言語処理や言語学においてコーパスは重要な役割を果たすが,従来のコーパスは大人の文章を集めたコーパスが中心であり,子供の文章を集めたコーパスは非常に少ない.その理由として,子供のコーパスに特有の様々な難しさが挙げられる.そこで,本論文では,子供のコーパスを構築する際に生じる難しさを整理,分類し,効率良く子供のコーパスを構築する方法を提案する.また,提案方法で実際に構築した「こどもコーパス」についても述べる.提案方法により,81人分(39,269形態素)のコーパスを構築することができ,提案方法の有効性を確認した.この規模は,公開されている日本語書き言葉子供コーパスとしては最大規模である.また,規模に加えて,「こどもコーパス」は作文履歴がトレース可能であるという特徴も有する.

言及状況

外部データベース (DOI)

Twitter (1 users, 5 posts, 0 favorites)

[日本語教育関連の論文・資料 172] ◇ 作文履歴をトレース可能な子供コーパスの構築 https://t.co/TQpviqAyYE #日本語教師 #日本語教育 #日本語学校
[日本語教育関連の論文・資料 172] ◇ 作文履歴をトレース可能な子供コーパスの構築 https://t.co/TQpviqipKw #日本語教師 #日本語教育 #日本語学校
[日本語教育関連の論文・資料 172] ◇ 作文履歴をトレース可能な子供コーパスの構築 https://t.co/TQpviqipKw
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 172] ■ 作文履歴をトレース可能な子供コーパスの構築 https://t.co/TQpviqipKw
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 172] ■ 作文履歴をトレース可能な子供コーパスの構築 https://t.co/TQpviqipKw

収集済み URL リスト