著者
中俣 尚己 山内 博之 橋本 直幸 建石 始 小口 悠紀子 小西 円 堀内 仁 森 篤嗣 合田 陽子 加藤 恵梨 澤田 浩子 清水 由貴子 山本 和英
出版者
京都教育大学
雑誌
基盤研究(B)
巻号頁・発行日
2018-04-01

2018年7月7日に京都教育大学で第1回ミーティングを行い、作業方針を固めた。以下、「新規コーパス構築」「既存コーパス分析」のそれぞれの作業について順番に実績を述べる。新規コーパス構築では、120ペア、240名の調査協力者を集めることにした。関西60ペア、関東60ペアで、さらに性別でも「男男」「男女」「女女」でバランスをとる。その上で、話題選定班の協力の元、『実践日本語教育スタンダード』を元に15の話題を選定し、各5分ずつの談話を録音することにした。調査に先立ち、協力者への説明や、同意の取り方、さらには指示の出し方など細かいプロトコルを定め、共有した。2018年度は120ペアのうち55ペアの録音を完了し、ほぼ半分の録音が完了した。2019年10月に全作業を完了する予定である。既存コーパス分析では、名大会話コーパスの全てのファイルを目で読み、『実践日本語教育スタンダード』をベースに話題の分割を行うことにした。プレ調査の結果、各ファイルにつき3名の作業者を当てることが妥当と判断した。分割のための書式を定め、結果を機械分析班が作成したプログラムで加工し、その後対面ですり合わせ作業を行う。全129ファイルを4分割して作業を進めることにした。現在、分割の作業進捗度は75%程度であり、全体の25%については2019年3月にすり合わせの作業を実施した。なお、代表者は全ファイルの作業をすでに終えている。作業の完了は2019年9月の見込みである。

言及状況

Twitter (1 users, 2 posts, 0 favorites)

ちょうど今頃は科研費の申請書を書く時期ですが、(有償で)科研費の研究協力者のご依頼もお待ちしています。実際に(昨年度まで分担者だったこともあって)下記課題のテキスト処理は私が行っています。 https://t.co/TafcKbrhYC
この科研費では日本語教育の観点から話題の研究を行っています。今回の名大コーパス話題付与に続き、新規に話題別の対話コーパスも作成中なので完成後にご紹介します。グループで自然言語処理は私一人ですが、使えそうなデータや知見は今後も順次公開していきます。 https://t.co/TafcKbrhYC

収集済み URL リスト