Hoe we een computer hebben leren Tinderen om nepprofielen te herkennen

Tijdens ons onderzoek naar datingsites die klanten met nepprofielen misleiden, valt al snel de naam van de grootste datingapp Tinder. Dankzij een bijzondere verzameling afbeeldingen van een tipgever, de hulp van de 'wereldrecordhouder Tinder-matches' en kunstmatige intelligentie hebben we uitgezocht welke nepprofielen jou naar dubieuze datingsites leiden.

Begin dit jaar heeft Pointer twee tv-uitzendingen gemaakt over oplichting via seksadvertenties en webcams. Naar aanleiding daarvan spreken we een tipgever die een bijzondere collectie afbeeldingen verzamelt.

Voorbeelden van nepprofielen die we van onze tipgever krijgen.

"De uitzending deed me denken aan de vele nepprofielen die ik dagelijks op Tinder voorbij zie komen", zegt de tipgever. In deze profielen wordt naar datingsites verwezen waar enkel nepprofielen op te vinden zijn. Zodra je op zo’n website de liefde van je leven probeert te vinden, kom je bedrogen uit: klanten betalen per verzonden bericht, en de personen achter de nepprofielen proberen je zo lang mogelijk aan de praat te houden.

Voor Pointer is dat het beginpunt van een nieuw onderzoek. Hoeveel nepprofielen staan er op Tinder, en naar welke websites leiden ze?

Lees ook ons nieuws

Header bij artikel over Tinder nepprofielen

Honderden vrouwelijke Tinder-profielen proberen Nederlanders naar nepdatingsites te lokken

Nepprofielen naar aanleiding van ons onderzoek door Tinder verwijderd.

Onder Nederlandse vrijgezellen is Tinder de populairste datingapp. Gebruikers krijgen een paar foto’s van personen te zien die bij hun in de buurt actief zijn. Door naar links (afwijzen) of rechts (goedkeuren) te swipen, kun je snel meerdere personen beoordelen. Swipen twee personen naar rechts op elkaars profiel, dan kunnen ze met elkaar chatten.

Het is een interessant gegeven dat datingwebsites onder valse voorwendselen via andere platforms, zoals Tinder, klanten proberen te trekken. Aan ons de uitdaging hoe we dat gaan onderzoeken. En daarvoor zijn we terechtgekomen bij de zelfbenoemde wereldrecordhouder Tinderen.

Wereldrecord Tinderen

In 2017 claimt een Oostenrijks fotomodel Jazz Egger dat ze het wereldrecord van de meeste Tinder-matches zou hebben, namelijk zo'n 5.400 – ook al heeft het Guinness Book of Records dat record nooit bevestigd. Kort daarop wordt het Engelse topmodel Stefan-Pierre Tomlin door Tinder uitgeroepen tot Mr. Tinder, omdat hij ongeveer 40 matches per dag zou halen.

Voor de Belgische Frederik Mees klinkt het als een uitdaging. De toenmalige student Computer Science schrijft een programma waarmee hij automatisch inlogt op Tinder, en profielen naar rechts swipet. Tegelijkertijd verzamelt de bot profielinformatie, zodat hij data-analyse op de gebruikers van de app kan doen. Nadat hij zijn script voor de eerste keer draait, verbleken de records van Egger en Tomlin: binnen 24 uur haalt hij al ruim duizend matches, en momenteel zit hij al rond de 30 duizend personen die naar rechts hebben geswiped op zijn geautomatiseerde profiel.

Frederik heeft een computer geleerd om te Tinderen. De code voor dit programma staat op zijn Github, een platform waar programmeurs code met elkaar delen. De website van Tinder is inmiddels iets gewijzigd, waardoor het script op Github niet meer precies weet op welke knoppen het moet drukken. In opdracht van Pointer heeft Frederik het script bijgewerkt zodat het weer werkt.

We doen een eerste steekproef onder ruim achtduizend mannelijke en vrouwelijke Tinder-profielen (ongeveer gelijk verdeeld). Daaruit blijkt al snel dat we enkel nepprofielen vinden die zich als vrouw voordoen. We besluiten daarom onze Tinder-bot los te laten op vrouwelijke profielen. In totaal analyseren we 33.793 profielen met in totaal 185.557 profielfoto's.

Als we in die gigantische bak met foto's handmatig op zoek willen gaan naar nepprofielen, dan zijn we uiteraard veel tijd kwijt. De kans op fouten wordt door vermoeidheid en onzorgvuldigheid ook een stuk groter naarmate we meer afbeeldingen moeten doorzoeken. We moeten dus op zoek naar een andere oplossing om afbeeldingen te sorteren.

We besluiten kunstmatige intelligentie te trainen om dat werk voor ons te doen.

Automatisch afbeeldingen sorteren

Met Lobe.ai kun je gratis een AI-model trainen om afbeeldingen te herkennen. De nepprofielen zijn te herkennen aan de tekst die erin staat. Op de meeste Tinder-foto’s staan mensen en gezichten zonder tekst. Hier kunnen we ons model dus goed op trainen. Dat werkt als volgt:

  • Je neemt een klein deel van je afbeeldingen en sorteert die handmatig in twee groepen: neutraal profiel (echte profielen) en nepprofiel. Dit noem je je trainingsdata. We vullen de nepprofielen aan met de afbeeldingen die onze tipgever ons heeft gestuurd.
  • De trainingsdata (twee mappen op onze harde schijf met echte en nepprofielen) zetten we in Lobe.ai. Het programma leert nu om echte en nepprofielen van elkaar te onderscheiden.
  • Na een flinke tijd trainen exporteren we het model als een Tensorflow-model. Dit stukje code kunnen we gebruiken om onze grote map met afbeeldingen te sorteren in echte en nepprofielen.
Screenshot van Lobe.ai

Onze trainingsdataset bestaat uit ongeveer vierduizend foto's: deze hebben we dus handmatig doorgezocht, en in de map echte of nepprofielen gezet. Hiermee leren we Lobe.ai de echte foto’s te onderscheiden van afbeeldingen waar tekst op staat. Het wordt echter ingewikkeld bij profielfoto’s van bestaande personen waar ook tekst op staat. Sommige Tinder-profielen kiezen ervoor om een inspirerende quote of comic als profielfoto te plaatsen. Hoe kun je ervoor zorgen dat je aan het einde van de rit overblijft met een betrouwbare verzameling nepprofielen?

Dat leerproces kun je op twee manieren aanpakken. Je kunt je model trainen om alle kleine nuances te herkennen. Dan plaats je alle inspirerende quotes bij de echte profielen, in de hoop dat het model leert om ze automatisch te sorteren in de juiste map. Het risico is echter dat een afbeelding van een nepprofiel dan per ongeluk in de grote bak met duizenden echte profielen terecht komt als die op zo'n quote lijkt.

We kiezen ervoor om het model zo te trainen dat alle afbeeldingen met tekst in de map met nepprofielen terechtkomen. Daarmee gaan we van een berg met ruim 180 duizend afbeeldingen naar een overzichtelijk map met iets meer dan honderd afbeeldingen. Daar zitten ook veel afbeeldingen tussen die overduidelijk niet nep zijn, maar die kunnen we eenvoudig verwijderen. Het belangrijkste is dat het model niet per ongeluk nepprofielen in de grote map met echte profielen plaatst.

Nadat we ons model hebben getraind en op de verzameling van 185.557 afbeeldingen loslaten, ontdekken we 83 nepprofielen. Tinder wil helaas niet zeggen hoeveel Nederlanders een account hebben. De Volkskrant, Rutgers en Ipsos hebben in 2019 geschat dat zo’n 13 procent van de Nederlanders een account heeft aangemaakt. Op basis van onze steekproef van 33.793 vrouwelijke profielen, komen we op een conservatieve schatting van ruim tweeduizend van dit soort nepprofielen in Nederland.

Makers