著者
山田 健太 青田 雅輝 並木 亮 横山 源太朗
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.2H1OS3a01, 2023 (Released:2023-07-10)

政治資金収支報告書は、政治団体によって提出され、政治資金規正法により公表が義務付けられています。しかし、これらの報告書は多くが手書き文字を含む紙媒体であり、機械判読に適さず、オープンデータの定義を満たしません。そのため、これらのデータをデータベース化することで透明性が向上し、市民による政治的な意思決定への参加が促進されると考えられます。本研究では、政治資金収支報告書の「(その2)収支の状況」に限定し、光学式文字認識(OCR)技術を用いてデータの抽出と整備を行いました。具体的には、2019年に提出された政治資金収支報告書に対し、収支の状況ページからデータを抽出し、データセットを構築しました。また、作成したデータセットを元に分析例を示しました。本研究は、政治資金データベースの作成に向けた第一歩であり、今後も政治資金報告書の形式やデータの改善に取り組むことが求められます。政治資金データベースの構築は、より透明で民主的な社会を実現するための重要な一歩であると考えられます。

言及状況

外部データベース (DOI)

はてなブックマーク (1 users, 1 posts)

[政治] 山田 健太, 青田 雅輝, 並木 亮, 横山 源太朗(2022)

Twitter (5 users, 5 posts, 11 favorites)

同じ苦労なら、朝駆け夜討ちではなく、OCRによる政治資金データベース化で苦労したい。 > 政治資金収支報告書の OCR による政治資金データベースへの試み https://t.co/1Xx5GuPZUi > 朝駆け、夜討ちの大変さや、その意義について説明をしています。 是非、ご覧ください! https://t.co/jZ4qMjkSyn
山田 健太, 青田 雅輝, 並木 亮, 横山 源太朗(2022)政治資金収支報告書のOCRによる政治資金データベースへの試み” (1 user) https://t.co/AwtR18cPsS #政治

収集済み URL リスト