著者
守岡 知彦
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2008, no.73(2008-CH-079), pp.17-22, 2008-07-18

古典中国語 (漢文) 電子テキストの蓄積が進む中、自然言語処理技術の重要性は高まって来ているが実装は少ない。本論文では、MeCab を用いた古典中国語用形態素解析器のプロトタイプについて概説するとともに、本格的な古典中国語文法コーパス作成のためのワークフローについて考察する。

言及状況

Twitter (1 users, 3 posts, 2 favorites)

(CONLL-U 形式っぽいものも返してくれるようになったが、「UDに基づいて係り受け解析してCONLL-U 形式で返して」って頼んでも形態素解析しかしてくれないし、日本語ベースなので、https://t.co/wbzBzAkidJ を作った時の最初のプロトタイプに近い感じ)
(https://t.co/wbzBzAkidJ を読み返したところ、最初は6階層品詞体系を使ってたみたいだが、https://t.co/fnBsMXRyGW の段階では4階層になってる(但し、この時点では山崎品詞体系になっていない)。4階層にしたのは確か学習時になぜか MeCab がセグメンテーションフォールトしたからだった気がw)
(まあ、でも、考えてみれば、古典中国語の形態素解析器が割と実用的に使えるようになってるのは、最初のネタ発表 https://t.co/wbzBzAkidJ の時のことを思うとびっくりなのだが、気がつけばもう10年もやってることもびっくりである。月日が経つのは早い)

収集済み URL リスト