Foto’s van kinderen illegaal gebruikt om AI tools te trainen
Voordat AI iets kan, moet het getraind worden. Dat doe je door informatie te voeden, bijvoorbeeld over hoe verschillende kinderen eruitzien. Met deze info kan de software zelf aan de slag om plaatjes te maken.
Human Rights Watch is een organisatie die de rechten van de mens in de gaten houdt, onder andere door onderzoek. Zij hebben ontdekt dat er 170 foto’s van Braziliaanse kinderen zonder toestemming zijn gebruikt voor een dataset om AI tools mee te trainen.
Scrapen
Hierbij zitten foto’s uit 2023 maar ook afbeeldingen uit de negentiger jaren. Hiermee heeft de set een volledig beeld van de hele jeugd van een kind. Deze 170 foto’s zijn maar het puntje van de ijsberg wanneer je weet dat de maar 0,0001 procent van de 5,85 miljard foto’s in de database is gescand door Human Rights Watch.
Het gaat hier om LAION-5B, een dataset die door veel populaire AI tools wordt gebruikt. Ze voeden hun database door het internet te scrapen. Hierbij is blijkbaar meer informatie meegekomen. In de links zijn ook de namen van een aantal van de kinderen te vinden. Hierdoor is het relatief eenvoudig om het kind te traceren.
Het Duitse (non-profit) bedrijf achter deze dataset heeft beloofd deze bewuste foto’s offline te halen. Dat verhindert toekomstige aanvragen van AI Tools om de foto’s te gebruiken. Niemand weet hoe veel en op wat voor manier de foto’s van deze kinderen al gebruikt zijn. Deze content circuleert al over het web en zal moeilijk te verwijderen zijn.
Mis niks, volg ons WhatsApp-kanaal of abonneer je op de Bright Daily nieuwsbrief.