Een tekstlijst met heel vaak de zin 'Nee, moet nog gebeld worden'

Zo verzamelden wij de verkiezingsdata van (bijna) alle gemeenten

Samen met de Volkskrant en de Open State Foundation verzamelden we de data van de Provinciale Staten- en waterschapsverkiezingen van (bijna) alle Nederlandse gemeenten. Waarom is dat nodig, en hoe deden we dat?

Een tekstlijst met heel vaak de zin 'Nee, moet nog gebeld worden'

Gemeenten zijn sinds 1 januari 2019 wettelijk verplicht om de zogenoemde proces-verbalen van de verkiezingen online te zetten. Dat zijn de tellingen die door de mensen in de stembureaus gemaakt zijn en later worden verzameld per gemeente. Daarnaast verzocht de minister om de telbestanden ook online te zetten, die machineleesbaar zijn (bijvoorbeeld in een pakket als Excel). Om die bestanden ging het ons. Als je een landelijk totaalbeeld wil krijgen van de uitslagen van de verkiezingen, per stembureau én per kandidaat heb je die bestanden nodig. Want tot nu toe was het alleen mogelijk om de totale uitslag te zien per gemeente. 

Na een eerste rondgang met een groep van zo’n tien mensen bleek dat slechts een kwart van de gemeenten die telbestanden online had staan. De 270 gemeenten die dat niet hadden, hebben we nagebeld en gemaild om deze data te krijgen. 

Die data kwam in meerdere formaten. De minister adviseerde een CSV-bestand te generen in het softwarepakket OSV (Ondersteunende Software Verkiezingen). Die software wordt door de meeste gemeenten gebruikt om de stemmen te tellen. Dat bestand vroegen we dus op.

Vaak kregen we inderdaad een CSV-bestand, soms ook een ‘EML XML’ bestand, wat dezelfde data heeft in een ander formaat. Soms kregen we ook PDF’s binnen, of een Excel-bestand met een indeling die de gemeente zelf had bedacht. Helaas konden we daar niks mee en moesten we nogmaals verzoeken om een CSV of XML-bestand.

Toen we eenmaal alles binnen hadden kon de volgende stap plaatsvinden: het verwerken van alle data tot één bestand. Om dat te doen, schreven we een tooltje om de data om te zetten in één groot CSV bestand. 

Wat leerden we uit dat enorme databestand? Bijvoorbeeld dat er op stations gemiddeld meer op Groenlinks en D66 werd gestemd dan in de gemeenten waar die stations liggen. Bij Groenlinks was dat verschil meer dan 7 procentpunten.

 

We hebben de data beschikbaar voor je als CSV van zowel de provinciale staten als voor de waterschappen. Nog meer data van de verkiezingen in andere formaten vind je op de site van Open State (provinciale staten, waterschappen).

Schrijf je in voor de nieuwsbrief

Blijf op de hoogte