30 Nederlandstalige podcasts verspreiden structureel misinformatie. Het gaat om schadelijk medisch advies, de extreemrechtse omvolkingstheorie en andere ongefundeerde complotten. Maar hoe onderzoek je tienduizenden uren audio om dat te ontdekken?
Bij Pointer doen we al jarenlang onderzoek naar misinformatie. Daarbij kijken we regelmatig naar verschillende media waarin nepnieuws zich kan verspreiden. Zo hebben we onderzocht hoe trollenlegers zijn georganiseerd, hoe publieke omroep Ongehoord Nederland complotten verspreidt, wat het bereik van haatzaaien op X / Twitter is, hoe het YouTube-algoritme je van politieke video’s naar misinformatie duwt, en hoe regelmatig klimaatvideo’s met misinformatie op TikTok langskomen. Maar tot voor kort was het nog niet mogelijk om goed onderzoek te kunnen doen naar podcasts.
9 jaar aan podcasts in 2023
Dat heeft grotendeels te maken met de doorzoekbaarheid van gesprekken in podcasts. Als je alle Nederlandstalige podcasts uit 2023 volledig zou moeten afluisteren, dan ben je daar 9 jaar mee bezig. Als je dan ook nog eens specifiek moet luisteren of er misinformatie wordt verspreid, dan is dat natuurlijk een onmogelijke taak.
Gelukkig hebben we hulp gekregen van onderzoekers die alle Nederlandstalige podcasts hebben verzameld en getranscribeerd met de transcriptiesoftware Whispercpp en Whisperx. Daardoor hebben we doorzoekbare teksten van zo’n 150.000 Nederlandse podcastafleveringen uit 2022 en 2023. Maar hoe ontdek je daar misinformatie in?
Richtlijnen en misinformatie
Uiteindelijk besloten we drie soorten misinformatie te onderzoeken: medische misinformatie, de omvolkingstheorie en complottheorieën. We kozen deze onderwerpen omdat we ze strak af konden bakenen en omdat de gevolgen van deze inhoud goed zichtbaar zijn in onze samenleving. Ook zijn de richtlijnen van de grootste podcastplatforms, Spotify, Apple Podcasts en YouTube, hier vrij duidelijk over.
Medische misinformatie wordt door Spotify het meest uitgebreid beschreven, namelijk “inhoud die gevaarlijke, onjuiste medische informatie of gevaarlijke, misleidende medische informatie promoot die offline schade kan veroorzaken of een directe bedreiging vormt voor de volksgezondheid.” Voorbeelden die Spotify noemt zijn ontkenning van ziekten zoals AIDS, COVID-19 of kanker, of de consumptie aanmoedigen van schadelijke of niet-werkzame middelen zoals ivermectine, hydroxychloroquine en waterstofsuperoxyde. De namen van ziekten of alternatieve geneesmiddelen zijn hierbij de meest duidelijke termen waarop je kunt zoeken in transcripties.
Daarnaast heeft elk platform wel een richtlijn die het aanzetten tot haat tegen een groep mensen gebaseerd op ras, religie, etniciteit, etc. verbiedt. We kozen er hiervoor om ons alleen te richten op de omvolkingstheorie: de theorie waarbij Westerse overheden doelbewust hun eigen bevolking – en daarmee hun eigen ‘superieure cultuur’ – zouden laten vervangen door niet-westerse migranten. Hier zouden linkse partijen baat bij hebben, omdat veel van deze migranten daarop zouden stemmen. Deze feitelijk onjuiste theorie is gemakkelijk te herkennen en te vinden in onze transcripties.
Als laatste keken we naar complottheorieën. Deze definieerden we als “gesprekken waarin wordt verwezen naar een elite (Joods, World Economic Forum, een wereldregering, aliens of andere groepen) die achter de schermen alles aan zou sturen. Hierbij wordt niet verwezen naar bronnen of bewijs waaruit blijkt dat deze groep daadwerkelijk iets aanstuurt of bepaalt.” Geen enkele platformrichtlijn verbiedt complottheorieën, maar we zien wel dat alle podcasts die complotten verspreiden, vervolgens ook medische misinformatie of de omvolkingstheorie verspreiden. Experts vertelden ons daarnaast dat het verspreiden van complottheorieën ook schade in de echte wereld kan veroorzaken, bijvoorbeeld bij het in brand zetten van 5G-masten. Daarom nemen we deze categorie wel mee in het onderzoek.
Structurele misinformatie
Nu kunnen we een lijst van zoekwoorden opstellen en code schrijven waarmee we de transcripten kunnen doorzoeken. We willen geen podcasts die incidenteel iets verkeerd doen, maar die structureel misinformatie verspreiden. Daarvoor moeten we per titel in minstens drie individuele afleveringen complotten, medische misinformatie of omvolking tegenkomen.
Onze eerste zoektocht leverde 7.500 fragmenten op die we handmatig hebben doorgenomen. Want de context waarin uitspraken worden gedaan, doet ertoe. In sommige gesprekken worden de complottheorieën weliswaar genoemd, maar worden ze juist weersproken, of wordt erover gesproken in een nieuwsbericht. In die gevallen telden we de afleveringen niet mee. Een van de gasten in een podcast kan zo’n complottheorie opwerpen, maar mogelijk wordt hij of zij tegengesproken door de host. Daarom hebben we sommige fragmenten ook moeten terugluisteren om te begrijpen hoe het gesprek rondom een specifieke uitspraak verloopt. Alleen wanneer een host of gast misinformatie uit en dit onweersproken blijft hebben we dit meegeteld.
We kwamen een aantal vreemde uitzonderingen en grensgevallen tegen. Een daarvan is een podcast waarin complotten vaak voor de grap worden aangehaald. Uit de context blijkt telkens dat de hosts er niet daadwerkelijk in geloven. Ook kwamen we erachter dat sommige teksten in een podcast automatisch zijn vertaald. Daardoor leek het alsof een dubieuze Italiaanse COVID-19-reportage – die werd uitgezonden door het Nederlandse Radio Salto in het programma Radio Onda Italiana, een programma voor Italiaanse Nederlanders – in het Nederlands werd verspreid als podcast. Omdat we enkel naar Nederlandstalige podcasts kijken, hebben we die aflevering ook genegeerd. Nederlandse podcasts waarbij af en toe een gast in het Engels wordt geïnterviewd, nemen we wel mee.
Resultaat
Uit ons onderzoek blijkt dat minstens 30 podcasts structureel misinformatie verspreiden over complotten, medisch advies of omvolking. Dit is hoogstwaarschijnlijk een onderschatting, omdat we een aantal zeer specifieke definities en zoekwoorden gebruiken: podcasts die misinformatie over voedingssupplementen verspreiden zullen uit ons onderzoek bijvoorbeeld niet naar voren komen, omdat we daar niet naar zoeken. Daarnaast missen we mogelijk wat kleine en onbekende podcasts in onze transcripten, omdat die enkel op alternatieve platforms te vinden zijn.