著者
飯田 龍 小町 守 乾 健太郎 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.7, pp.71-78, 2007-01-26
被引用文献数
12

本稿では,日本語書き言葉を対象とした述語項構造と共参照のタグ付与について議論する.述語項構造や共参照解析は形態素・構文解析などの基盤技術と自然言語処理の応用分野とを繋ぐ重要な技術であり,これらの問題の主要な解析手法はタグ付与コーパスに基づく学習ベースの手法である.この手法で利用するための大規模な訓練データが必要となるが,これまでに日本語を対象にした大規模なタグ付きコーパスは存在しなかった.また,既存のコーパス作成に関する研究で採用されているタグ付与の基準は,言語の違いや我々が対象としたい解析と異なるために,そのまま採用することができない.そこで,既存のいくつかのタグ付与の仕様を比較し,我々のタグ付与作業で採用する基準について吟味する.また,実際に京都コーパス第3.0版の文章を対象にタグ付与の仕様について検討した結果とタグ付与の際に問題となった点や今後検討すべき点について報告する.In this paper, we discuss how to annotate predicate-argument and coreference relations in Japanese written text. Predicate argument analysis and coreference resolution are particularly important as they often provide a crucial bridge between basic NLP techniques such as morpho-syntactic analysis and end-level applications, and they have been mainly developed with corpus-based empirical approaches. In order to train a classification model in such approaches, a large scale corpus annotated with predicate-argument and coreference information is needed. To our best knowledge, however, there is no corpus including plenty of such tags in Japanese. In addition, we have difficulty adopting the traditional specifications for annotating tags due to the problem setting of each task and the difference between Japanese and English. So, we develop a new criteria for our annotating processes by examining the previous work on annotating tasks. This paper explains our annotating specification cultivated through actual annotating processes for the texts in Kyoto Text Corpus version 3.0, and discusses the future directions.

言及状況

Twitter (1 users, 7 posts, 0 favorites)

[日本語教育関連の論文・資料 136] ◇ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun #日本語教師 #日本語教育 #日本語学校
[日本語教育関連の論文・資料 136] ◇ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun #日本語教師 #日本語教育 #日本語学校
[日本語教育関連の論文・資料 136] ◇ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 136] ■ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 136] ■ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxXQSX
【BOT】 [ ネット上で読める日本語教育関連の論文・資料 136] ■ NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun
:BOT: [ ネット上で読める日本語教育関連の論文・資料など]  ■  NAISTテキストコーパス:述語項構造と共参照関係のアノテーション https://t.co/H1fVOxGfun

収集済み URL リスト