Grote websites blokkeren Apple: gebruik onze data niet voor AI-training

©Unsplash

29 augustus 2024 om 15:46

Erwin Vogelaar
Redacteur

Net als elk AI-bedrijf, heeft ook Apple data nodig om zijn Apple Intelligence te trainen. Veel grote nieuwswebsites en sociale media hebben daar geen zin in en blokkeren het bedrijf daarom.

Apple introduceerde onlangs een tool die uitgevers kunnen instellen als ze niet willen dat Apple hun data gebruikt voor het trainen van zijn AI. Allerlei grote mediawebsites en sociale media hebben daar gretig gebruik van gemaakt.

Wired heeft rondgekeken welke partijen deze tool hebben ingesteld. Dat gaat onder andere om The York Times, The Financial Times, The Atlantic, Vox Media, USA Today en Condé Nast: de grootste mediawebsites van de Verenigde Staten.

Weinig verrassend is dat Facebook, Instagram en Tumblr ook niet willen dat Apple hun data gebruikt. Ook de Amerikaanse versie van Marktplaats, Craigslist, gebruikt de tool om Apple te blokkeren.

Applebot

Apple gebruikt al jaren een crawler genaamd Applebot om websites te bekijken, zodat ze geïndexeerd kunnen worden en opduiken bij zoekopdrachten via bijvoorbeeld Siri of Spotlight. De functies van Applebot zijn recentelijk uitgebreid, omdat die nu data verzamelt om Apple Intelligence mee te trainen.

De tool die bedrijven kunnen installeren om Apple te weren van het verzamelen van deze data, weerhoudt Applebot er niet van om hun websites gewoon te blijven indexeren.

Datajournalist Ben Welsh houdt 1157 Engelstalige nieuwswebsites in de gaten om te zien of ze de crawlers van AI-bedrijven toestaan. Het blijkt dat meer dan 51 procent van al deze websites de crawler van OpenAI weren. De crawler van Google AI wordt door iets meer dan 43 procent geweerd. Nog maar een kwart van de websites blokkeert de crawler van Apple, maar tegenover Wired zegt Welsh dat dit aantal wel stijgt.

Lees meer over Apple, of blijf op de hoogte via de Bright-app.