著者
山田 健太 青田 雅輝 並木 亮 横山 源太朗
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.2H1OS3a01, 2023 (Released:2023-07-10)

政治資金収支報告書は、政治団体によって提出され、政治資金規正法により公表が義務付けられています。しかし、これらの報告書は多くが手書き文字を含む紙媒体であり、機械判読に適さず、オープンデータの定義を満たしません。そのため、これらのデータをデータベース化することで透明性が向上し、市民による政治的な意思決定への参加が促進されると考えられます。本研究では、政治資金収支報告書の「(その2)収支の状況」に限定し、光学式文字認識(OCR)技術を用いてデータの抽出と整備を行いました。具体的には、2019年に提出された政治資金収支報告書に対し、収支の状況ページからデータを抽出し、データセットを構築しました。また、作成したデータセットを元に分析例を示しました。本研究は、政治資金データベースの作成に向けた第一歩であり、今後も政治資金報告書の形式やデータの改善に取り組むことが求められます。政治資金データベースの構築は、より透明で民主的な社会を実現するための重要な一歩であると考えられます。
著者
並木 亮佑 谷口 香苗
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. ET, 教育工学 (ISSN:09135685)
巻号頁・発行日
vol.110, no.453, pp.1-4, 2011-02-25

アンケートなどの多変量データを用いてクラスター分析を行う場合、マルチコが発生し、クラスターが得られない場合がある.そこで、有意差の見られる高相関グループより、グループを代表する変量を残して他を削除し、有意差の見られない変量はそのまま採用する高相関代表化法および、変量ごとの確率分布の類似性に着目して分類する分布類似度検査法を提案する.そして、実際にマルチコが発生しているアンケート結果を用いて、従来法のward法および、提案する2つの手法を用いてクラスター分析を行った結果、いずれの手法でも3つのクラスターが抽出可能であり、同一のネーミングができた.特に、ward法はクラスター分割やネーミングに困難さがあるが、提案手法は容易に分割可能であった.