著者
浅原 正幸 金山 博 宮尾 祐介 田中 貴秋 大村 舞 村脇 有吾 松本 裕治
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.26, no.1, pp.3-36, 2019-03-15 (Released:2019-06-15)
参考文献数
40
被引用文献数
2 3

Universal Dependencies (UD) は,共通のアノテーション方式で多言語の構文構造コーパスを言語横断的に開発するプロジェクトである. 2018 年 6 月現在,約 60 の言語で 100 以上のコーパスが開発・公開されており,多言語構文解析器の開発,言語横断的な構文モデルの学習,言語間の類型論的比較などさまざまな研究で利用されている. 本稿では UD の日本語適応について述べる.日本語コーパスを開発する際の問題点として品詞情報・格のラベル・句と節の区別について議論する.また,依存構造木では表現が難しい,並列構造の問題についても議論する.最後に現在までに開発した UD 準拠の日本語コーパスの現状を報告する.

言及状況

外部データベース (DOI)

はてなブックマーク (1 users, 1 posts)

[nlp][paper][universalDependencies] Universal Dependencies 日本語コーパス

Twitter (8 users, 8 posts, 5 favorites)

日本語のUDについては、こちらをご覧ください。 J-STAGEトップ/自然言語処理/26 巻 (2019) 1 号/書誌 論文 Universal Dependencies 日本語コーパス 浅原 正幸, 金山 博, 宮尾 祐介, 田中 貴秋, 大村 舞, 村脇 有吾, 松本 裕治 https://t.co/ZC69kURcdo
@mindful_jt Ah, I was talking more about the general rules than the datasets. The official page doesn't even link to all the defining papers; this one is particularly important. I guess I should make a page gathering it all... https://t.co/bzEWtnL573
たとえば「食べて走る人」という文があったとき,UDの左主辞原則に則ると連体形でない「食べ」が名詞の「人」にかかってしまって不自然な構造になるから,というのが理由らしく,なるほどとなった https://t.co/PpoPiG6DM4
まとまっててすごい勉強になります。 Universal Dependencies 日本語コーパス https://t.co/3f0DYLGdnV

収集済み URL リスト