著者
濱島 京子
出版者
独立行政法人 労働者健康安全機構 労働安全衛生総合研究所
雑誌
労働安全衛生研究 (ISSN:18826822)
巻号頁・発行日
vol.15, no.2, pp.177-188, 2022-09-30 (Released:2022-09-30)
参考文献数
17

厚生労働省は,職場のあんぜんサイトにて労働災害の発生状況等を記載した「死亡災害データベース」および「労働災害(死亡・休業4日以上)データベース」をExcelデータで公開している.このExcelデータの機械判読性は高くなく,自然言語処理技術などのコンピュータプログラムを用いてデータを加工,編集,分析をする際に様々な問題が起こりやすいことが課題となっている.そこで,総務省が示した「統計表における機械判読可能なデータの表記方法の統一ルール」を援用し,機械判読上の問題点を調査した.さらに,定型データ項目における誤記や表記ゆれの状況等を把握した.そして,これら問題の具体的な内容を示した上で,不具合の発生を抑止するためにデータベースシステムを活用すべきこと,テキストファイルに記述可能な半構造化データ形式によるデータ公開を提言した.

言及状況

外部データベース (DOI)

Twitter (2 users, 2 posts, 2 favorites)

濱島京子. (2022). 機械判読の観点からみた労働災害データベースの課題. 労働安全衛生研究, 15(2), 177-188. https://t.co/X4I1IAxzZH https://t.co/bGl2TXADLq

収集済み URL リスト