著者
山崎 誠 相良 かおる 小野 正子 東条 佳奈 麻 子軒 Makoto Yamazaki Kaoru Sagara Masako Ono Kana Tojo Tzu-Hsuan Ma
出版者
国立国語研究所
雑誌
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
巻号頁・発行日
no.4, pp.161-168, 2019

会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター本発表では、電子医療記録に含まれる実践医療用語の語構成を明らかにするために、独自に設計した語構成要素への分割とそれに対する意味ラベルの付与を行い、意味ラベルによる語構成のパターンを調査した。調査対象は、ComeJisyoSjis-1(111,664語)から、『分類語彙表 増補改訂版』に収録されている語を含む約7,000語から抽出した1,000語である。これらを短単位よりやや長めの語構成要素に分割し、意味ラベルを付与した。意味ラベルは、石井(2007)の複合名詞の語構造把握のための意味分類を参考にしたが、実践医療用語のために独自に設けたものも多い。分析結果から、以下のような点が明らかになった。(1)語構成要素数が2個と3個のものが全体の8割以上を占める。(2)意味ラベルは、「疾患」「身体部位」「状態」「症状」「医療行為」「時間」「生理」の7つで全体の約8割を占める。(3)意味ラベルは、語頭により多く出現するもの(「身体部位」「時間」)や語末により多く出現するもの(「医療行為」「症状」「障害」)などがあり、分布に偏りが見られる。
著者
相良 かおる 小野 正子 鈴木 隆弘 小木曽 智信 高崎 光浩 浅原 正幸 外山 健二
出版者
西南女学院大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

標準化された用語がないまま、電子カルテシステムは普及し、電子医療記録文書が蓄積される中、我々は医療記録文書で使われる用語77, 775語を収録した辞書ComeJisyoを作成・公開し、また、語種と字種の分布を明らかにした。ComeJisyoは、電子医療記録文の単語分割の解析精度を90%以上に向上させ、複数の解析結果の比較(メタ分析)を可能とする。また、ComeJisyoに付加されるヨミガナは、音声への変換や仮名漢字変換等に活用できる