著者
小林 雄一郎 小木曽 智信
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.6, pp.29-43, 2013-11

本研究の目的は,中古和文コーパスを分析対象とし,個人文体とジャンル文体の関係を明らかにすることである。具体的には,紫式部の『源氏物語』と『紫式部日記』,そして『更級日記』における助詞・助動詞の使用傾向を調査し,テクスト間の相互関係,言語項目間の相互関係,テクストと言語項目の結びつきのパターンを定量的に分析する。そして,多変量解析の手法を援用し,中古和文のテクストにおいて,書き手による文体差よりもジャンルによる文体差の影響が大きいことを示す。さらに,個々のテクストにおける語彙使用を詳細に分析するために,対数尤度比による特徴語抽出を行い,多変量解析の結果を補完する。
著者
相良 かおる 小野 正子 鈴木 隆弘 小木曽 智信 高崎 光浩 浅原 正幸 外山 健二
出版者
西南女学院大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

標準化された用語がないまま、電子カルテシステムは普及し、電子医療記録文書が蓄積される中、我々は医療記録文書で使われる用語77, 775語を収録した辞書ComeJisyoを作成・公開し、また、語種と字種の分布を明らかにした。ComeJisyoは、電子医療記録文の単語分割の解析精度を90%以上に向上させ、複数の解析結果の比較(メタ分析)を可能とする。また、ComeJisyoに付加されるヨミガナは、音声への変換や仮名漢字変換等に活用できる
著者
田中 牧郎 岡島 昭浩 岡部 嘉幸 小木曽 智信 近藤 明日子
出版者
独立行政法人国立国語研究所
雑誌
基盤研究(C)
巻号頁・発行日
2006

明治後期から大正期にかけて進んだ「言文一致」という出来事について,コーパスを活用して,精密かつ見通しよく記述することを通して,コーパス言語学の方法を日本語史研究に適用することを目指した。言文一致にかかわる言語現象のうち,コーパスを活用して記述することで,新たな日本語史研究の視野が拓けると想定されるものとして,語彙体系の変化,待遇表現構造の変化,テンス表現の変化の三つを取り上げて,『太陽コーパス』(言文一致期にもっともよく読まれた総合雑誌を対象とするコーパス)を用いた分析を行い,その成果を発表した。語彙体系については,動詞を例に,言文一致期に定着する語と衰退する語とを対比的に分析した。また,待遇表現構造については,二人称代名詞を例に,会話の文体や,話し手と聞き手の階層や性別の観点から分析した。さらに,テンス表現については,口語助動詞「テイル」「テアル」が定着する用法と,文語助動詞「タリ」が残存する用法とが相補関係にあることなどを解明した。いずれの研究においても,コーパスを用いることによって,共起語,出現文脈,出現領域などを定量的に考察することができ,共時的な構造分析の方向にも,通時的な動態分析の方向にも,新しい展開を図ることができた。コーパスを使わない従来型の研究では実現不可能だった,精密で見通しのよい記述を達成することができ,コーパスを日本語史研究に導入する意義を具体的に確かめることができた。また,コーパス分析ツールとして,XML文書へのタグ埋め込みプログラム『たんぽぽタガー』を開発し,使用説明書とともにweb上で公開した。このツールの公開は,コーパス言語学による日本語史研究の利便性を高める効果が期待できる。