Op deze afbeelding staan de silhouetten van Mowgli en Mulan voor een screenshot van de data die gebruikt is bij dataonderzoek naar tekstverdeling in Disney-films.

111.942 woorden uit Disney animatiefilms onder de loep genomen

Hoe wij ontdekten dat mannen drie keer zoveel zeggen als vrouwen in Disney-films.

Op deze afbeelding staan de silhouetten van Mowgli en Mulan voor een screenshot van de data die gebruikt is bij dataonderzoek naar tekstverdeling in Disney-films.

Vrouwen spreken nog geen 30 procent van de tekst uit in animatiefilms van Disney. Dat blijkt uit een tekstanalyse van ons op de twintig populairste Disney animatiefilms. Twintig films, dat komt neer op 111.942 woorden. Hoe pak je zo’n onderzoek aan? En welke keuzes komen hierbij kijken?  

Meer dan 600 films

Disney heeft in de loop der jaren meer dan 600 films uitgebracht. Onze eerste taak is om deze enorme lijst aan films te verkleinen naar een hanteerbaar aantal. We beperken ons daarom tot de populairste Disney animatiefilms en nemen daarbij alleen de films mee die vallen onder zogeheten ‘Walt Disney Classics’, denk daarbij aan Sneeuwwitje, Pocahontas, Mulan, etc. We nemen niet de films van bijvoorbeeld Pixar mee, deze films vallen onder Disney maar Pixar is nog wel een aparte tak binnen het bedrijf. Om de populairste films te vinden, kijken we naar de beoordeling op IMDB (Internet Movie Database) en naar wat de film in de bioscoop heeft opgebracht.

We kiezen ervoor om films met dieren ook mee te nemen in de analyse. Dit doen we omdat dieren in Disney-films praten en ook hierin onderscheid wordt gemaakt tussen mannen en vrouwen. De dieren hebben menselijke karaktertrekken. Ze kunnen praten, zingen, emoties tonen. Dit heeft dus wel degelijk invloed op hoeveel verschillende genders aan het woord zijn in Disney-films.

Met hulp van de fans

Veel diehard Disney fans hebben hun favoriete films uitgeschreven. Deze transcripten gebruiken we voor de analyse, de officiële scripts van Disney zijn online namelijk niet te vinden. In deze transcripten kunnen dus fouten zitten, fans zijn ook maar mensen. Maar om deze fouten zoveel mogelijk te beperken leggen wij de scripts naast de film quotes die op IMDB te vinden zijn. Komen deze quotes overeen dan vinden wij de transcripts betrouwbaar genoeg om mee te werken. Ook lezen we de scripts volledig door en passen we (spel)fouten aan als we die tegenkomen.

De scripts zetten we in het programma R en maken we ‘schoon’; we halen enters weg, dubbele spaties, gekke tekens en beschrijvingen van wat karakters doen. We maken hierbij gebruik van het R package ‘tidyverse’. Als in het script bijvoorbeeld het volgende staat: “Ariel: (Picking petals off a flower) He loves me . . . hmmm, he loves me not. . . .  He loves me! I knew it!”. Maken we daar het volgende van: “Ariel: He loves me hmmm he loves me not He loves me I knew it”. We nemen vervolgens alle zinnen samen die beginnen met “Ariel:” en hebben hiermee alle woorden gevonden die Ariel in de film zegt.

Woorden tellen

Nu gaan we woorden tellen. Nou, om precies te zijn schrijven we een script in het programma R dat voor ons gaat tellen, hierbij gebruiken we de package ‘quanteda’. Die telt alle woorden in de films en schrijft het aantal woorden toe aan mannelijke of vrouwelijke personages. We houden hierbij geen rekening met de genderidentificatie van de karakters, want of Simba zich nou als man of vrouw identificeert, wordt in de film niet specifiek gezegd. We hebben puur gekeken of de stemacteurs van de personages op IMDB acteur of actrice genoemd worden.

We nemen de karakters mee in de analyse die meer dan vijf keer in de film tekst hebben. Kleinere personages komen niet altijd voor in de credits en hebben maar een klein aandeel in het totaal aantal woorden. Ze hebben daardoor weinig invloed op het percentage van tekst plus het is lastig om te bepalen welk geslacht deze personages hebben in het geval van bijvoorbeeld dieren. Want welke van de olifanten in Jungle Boek is nou Olifant #2? En is dat dan een man of een vrouw?

Kanttekeningen

Twintig films is niet representatief voor de meer dan zeshonderd Disney-films, dat weten wij natuurlijk ook wel. Daarnaast is het woordaantal van een personage niet het enige meetpunt voor genderrepresentatie. Woordaantal is niet hetzelfde als spreektijd. Als een personage minder woorden heeft dan een andere maar wel langere woorden, dan kan het best zo zijn dat de spreektijd van dat eerste personage langer is dan van het personage met meer woorden. We nemen niet mee hoelang een personage aan het woord is.

Wij zijn ons er ook van bewust dat veel verhalen niet van Disney zelf afkomstig zijn. Zo is Sneeuwwitje een sprookje van de Gebroeders Grimm en De kleine zeemeermin een sprookje van Hans Christian Andersen. Deze karakters en verhaallijnen kunnen we Disney dus niet toeschrijven. Maar de scripts van de films zijn, ook al zijn ze gebaseerd op de oorspronkelijke verhalen, wel geschreven door Disney zelf. Ook de keuze om deze specifieke verhalen te verfilmen ligt bij Disney. De scripts van de films kunnen we Disney dus aanrekenen.

Ook is tekst niet de enige variabele die iets zegt over genderrepresentatie. Ook het karakter van de personages speelt mee. Zoals Marike Sterk, hoofd publiciteit van Disney Nederland, in ons artikel al terecht zegt: ‘Tekst zegt niet alles’. En deze films zijn gemaakt in verschillende tijdsperioden. De resultaten van het onderzoek zeggen dus alleen iets over het aantal woorden bij de twintig meest populaire Disney animatiefilms en zijn daarmee niet meteen relevant voor alle Disney-films of alle Disney-films die nu gemaakt worden.

Schrijf je in voor de nieuwsbrief

Blijf op de hoogte