著者
小木曽 智信 小椋 秀樹 田中 牧郎 近藤 明日子 伝 康晴
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.4, pp.1-8, 2010-01-30

現在開発を行っている「中古和文UniDic」を紹介する.これは平安時代の仮名文学作品を典型とする和文系の資料を対象とする形態素解析辞書であり,すでに公開中の「近代文語UniDic」同様,日本語の歴史的資料の形態素解析を可能にするものである.In this paper, we present "Chuko-Wabun UniDic", which is an electrical dictionary for morphological analysis of classical Japanese. The dictionary is especially designed for the analysis of literary texts in the Heian period, and is an effective means for examining historical texts, like "Kindai-Bungo UniDic" for modern Japanese.
著者
田中 牧郎 岡島 昭浩 岡部 嘉幸 小木曽 智信 近藤 明日子
出版者
独立行政法人国立国語研究所
雑誌
基盤研究(C)
巻号頁・発行日
2006

明治後期から大正期にかけて進んだ「言文一致」という出来事について,コーパスを活用して,精密かつ見通しよく記述することを通して,コーパス言語学の方法を日本語史研究に適用することを目指した。言文一致にかかわる言語現象のうち,コーパスを活用して記述することで,新たな日本語史研究の視野が拓けると想定されるものとして,語彙体系の変化,待遇表現構造の変化,テンス表現の変化の三つを取り上げて,『太陽コーパス』(言文一致期にもっともよく読まれた総合雑誌を対象とするコーパス)を用いた分析を行い,その成果を発表した。語彙体系については,動詞を例に,言文一致期に定着する語と衰退する語とを対比的に分析した。また,待遇表現構造については,二人称代名詞を例に,会話の文体や,話し手と聞き手の階層や性別の観点から分析した。さらに,テンス表現については,口語助動詞「テイル」「テアル」が定着する用法と,文語助動詞「タリ」が残存する用法とが相補関係にあることなどを解明した。いずれの研究においても,コーパスを用いることによって,共起語,出現文脈,出現領域などを定量的に考察することができ,共時的な構造分析の方向にも,通時的な動態分析の方向にも,新しい展開を図ることができた。コーパスを使わない従来型の研究では実現不可能だった,精密で見通しのよい記述を達成することができ,コーパスを日本語史研究に導入する意義を具体的に確かめることができた。また,コーパス分析ツールとして,XML文書へのタグ埋め込みプログラム『たんぽぽタガー』を開発し,使用説明書とともにweb上で公開した。このツールの公開は,コーパス言語学による日本語史研究の利便性を高める効果が期待できる。