著者
秋山 寛子 和田 昌昭 中山 雅哉 加藤 朗 砂原 秀樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.57, no.12, pp.2675-2681, 2016-12-15

プライバシ保護の観点から匿名化技術の重要度が高まっており,なかでもk-匿名化が活発に研究されている.k-匿名化のためのアルゴリズムとしてはMDAVやVMDAVなどが提案されているが,数値データの匿名化において,それらは情報損失の観点から必ずしも最良のものとはなっていない.本論文では,それらのアルゴリズムによって得られたデータの分割を,k-匿名性を保ったまま修正して情報損失を極小にする方法を提案する.またそれを実装して,いくつかのデータセットに適用し評価を行う.データ総数をkで割った余りが大きい場合の多くで,MDAVやVMDAVによる情報損失を提案アルゴリズムにより改善可能である.また,提案アルゴリズムは,データ総数によらず高速に実行可能である.