著者
山崎 誠 相良 かおる 小野 正子 東条 佳奈 麻 子軒 Makoto Yamazaki Kaoru Sagara Masako Ono Kana Tojo Tzu-Hsuan Ma
出版者
国立国語研究所
雑誌
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
巻号頁・発行日
no.4, pp.161-168, 2019

会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター本発表では、電子医療記録に含まれる実践医療用語の語構成を明らかにするために、独自に設計した語構成要素への分割とそれに対する意味ラベルの付与を行い、意味ラベルによる語構成のパターンを調査した。調査対象は、ComeJisyoSjis-1(111,664語)から、『分類語彙表 増補改訂版』に収録されている語を含む約7,000語から抽出した1,000語である。これらを短単位よりやや長めの語構成要素に分割し、意味ラベルを付与した。意味ラベルは、石井(2007)の複合名詞の語構造把握のための意味分類を参考にしたが、実践医療用語のために独自に設けたものも多い。分析結果から、以下のような点が明らかになった。(1)語構成要素数が2個と3個のものが全体の8割以上を占める。(2)意味ラベルは、「疾患」「身体部位」「状態」「症状」「医療行為」「時間」「生理」の7つで全体の約8割を占める。(3)意味ラベルは、語頭により多く出現するもの(「身体部位」「時間」)や語末により多く出現するもの(「医療行為」「症状」「障害」)などがあり、分布に偏りが見られる。