著者
八重樫 文絵 荒木 雅弘 岡 夏樹 新谷 元司 吉川 昌孝
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1H3J1305, 2019 (Released:2019-06-01)

本稿では,レセプトデータを用いた生活習慣病の発症予測システムを提案する.近年運送業界では,インターネットの普及に伴うドライバーの過重労働に対する対策として,健康管理対策の見直しを急務としている.発症予測を目的とした関連研究には,医療情報に対して表現学習を用いているものがある.これらの関連研究と同様に,我々は本研究の課題を自然言語処理の分野の文書分類問題として捉え,生活習慣病の発症予測を行うモデルの開発を試みた.我々は文字列として保存されているレセプトデータを固定長ベクトル化し,アンダーサンプリングとバギングの組み合わせによって生活習慣病の発症を予測した.その結果,我々のモデルは正例の再現率が0.75にまで昇り,レセプトデータに対して自然言語処理を施すことの有効性が示された.
著者
恒川 充 岡 夏樹 荒木 雅弘 新谷 元司 吉川 昌孝 谷川 武
出版者
The Japanese Society for Artificial Intelligence
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
pp.4D3E205, 2019 (Released:2019-06-01)

本研究では,定期的な健診データを用いて生活習慣病の発症を予測する手法を提案する.レセプトデータを精査して疾病の発症を特定し,それらを教師あり学習のための正例として使用した.クラスバランスが不均衡なデータであるという問題に対処するために,アンダーサンプリングとバギングのアプローチを採用した.がん以外の生活習慣病が1年以内に発症するかどうかを予測することを目的とした.提案手法のprecisionとrecallはそれぞれ0.32と0.89であった.各検査項目に閾値を設定し,それらの論理和をとるというベースライン手法と比較して,提案手法はrecallを維持しながらより高いprecisionが得られることが分かった.これは,重症化しそうな対象者の見落としを増やすことなく,保健指導の対象者数を抑えることができるという点で意義がある.