著者
西原 史暁
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.67, no.9, pp.448-453, 2017-09-01 (Released:2017-09-01)

本稿では整然データという概念について紹介し,それがどのように有用かを議論し,その限界についても触れる。整然データとは,①個々の値が1つのセルをなす,②個々の変数が1つの列をなす,③個々の観測が1つの行をなす,④個々の観測ユニットの類型が1つの表をなすという条件を満たす表型のデータである。これは,データ利用者にとって有用な概念であり,特にデータ分析用のプログラミング言語であるRを使う際には重要になってくる。この概念はデータ利用者だけでなく,データ提供者にとっても有用なものであり,データ共有の際にも応用できる。