著者
三枝 令子 丸山 岳彦 松下 達彦 品川 なぎさ 稲田 朋晃 山元 一晃 石川 和信 小林 元 遠藤 織枝 庵 功雄
出版者
公益社団法人 日本語教育学会
雑誌
日本語教育 (ISSN:03894037)
巻号頁・発行日
vol.176, pp.33-47, 2020-08-25 (Released:2022-08-26)
参考文献数
16

執筆者らは,日本で医学教育を受け,最終的に日本の医師国家試験合格を目指す外国人学習者に効果的な支援を行うことを目的として,医学用語の調査研究並びに教材作成を進めている。一口に医学用語といっても,その範囲は多岐にわたるため,医学用語の効率的な学習を目指すならば,まず医学用語の網羅的な収集と体系的な分類が必要になる。そこで本研究では,医学用語の体系的な語彙リストを作成する準備段階として,医学書のテキストから医学書コーパスを構築し,27種類の診療分野に分けて,そこに含まれる語を収集・分類した。その上で,高頻度の助詞,接辞,動詞や,領域特徴度の高い名詞について,医学テキスト固有の特徴という観点から分析を行った。その結果,接辞や動詞において医学分野特有の語がみられた。また,名詞に関しては診療分野ごとに頻出語が異なることから,診療分野別に語彙リストを構築することが重要であることがわかった。
著者
加藤 祥 柏野 和佳子 立花 幸子 丸山 岳彦
出版者
国立国語研究所
雑誌
国立国語研究所論集 = NINJAL research papers (ISSN:2186134X)
巻号頁・発行日
no.8, pp.85-108, 2014-11

国立国語研究所 コーパス開発センター プロジェクト研究員国立国語研究所 言語資源研究系国立国語研究所 コーパス開発センター 技術補佐員国立国語研究所 言語資源研究系書籍テキストに見られる「語りかける」という文体の特徴を報告する。調査対象には,『現代日本語書き言葉均衡コーパス』(BCCWJ)に収録されている図書館サブコーパスを使用した。コーパスを用いた文体分析を行うにあたっては,語や文脈的な語の結びつきなどの頻度情報のほか,コーパスに付与された書誌情報やアノテーターによる作業コメントなどを用いた。「語りかける」という文体は,エッセイやブログなどのくだけたテキストにのみ出現しやすく,直接的に読み手へ呼びかけや問いかけを行うなどの表現を有すると考えられてきた。しかし,書籍においては,いわゆるハウツー本をはじめとするような教示的な態度を示すテキストに出現しやすい傾向があり,必ずしも直感的に「語りかける」ととらえられる表現が多く含まれるばかりではないことがわかった。本稿は,テキストが「語りかける」と読み手が判断した際に,文脈に依存した表現や,テキストに向かう読み手の前提的態度などが影響していたことを示す。
著者
丸山 岳彦 柏岡 秀紀 熊野 正 田中 英輝
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.11, no.3, pp.39-68, 2004-07-10 (Released:2011-03-01)
参考文献数
35
被引用文献数
6 10

従来の文分割研究において, 文の分割点として利用されてきたのは, 「節」の境界である. しかしながら, 実際に文の分割点として用いられる節境界はごく一部の種類のものに限られており, 文に含まれる節境界を網羅的に検出する手法は考えられてこなかった. 我々は, 日本語の文に含まれる節境界の位置を網羅的に検出し, その種類を特定するプログラム“CBAP (Clause Boundaries Annotation Program)”を開発した. CBAPは, 形態素解析の結果を入力とし, 局所的な形態素の連接を対象としたパタンマッチによって, 147種類の節境界を検出する. CBAPを性質の異なる5種のコーパスに適用したところ, いずれのコーパスでも97%以上の検出性能が確認された. この検出結果を利用することにより, 言語学的に意味のある文の分割点を特定することができ, 従来の手法よりも柔軟に文分割を行なうことができる. また, 1~3形態素という非常に局所的な範囲のみから節境界を検出できるため, 発話に追従して処理を進めていく漸進的構文解析や同時通訳システム, また, 句点を含まない音声コーパスを対象とした発話分割処理などに有用である. 本稿では, CBAPによる節境界の検出手法を示し, 節境界を用いて文分割・発話分割処理を行なった事例をもとに, 節境界検出の有用性を述べる.