Rajeshwar Bachu/Unsplash

Google past beleid aan: alles wat je online zet is nu AI-lesmateriaal

4 juli 2023 om 12:51

Laatste update: 4 juli 2023 om 12:56

Google heeft zijn beleid aangepast en traint zijn kunstmatige intelligentie voortaan met alles wat openbaar online staat.

Het nieuwe beleid van Google geldt sinds 1 juli, en werd gespot door Gizmodo. De wijzigingen zijn te lezen in zowel de Nederlandse als de Engelstalige versie van het privacybeleid. Op deze Engelse vergelijkingspagina is precies te zien wat er veranderd is. Google stelt nu: "We kunnen bijvoorbeeld informatie verzamelen die online openbaar beschikbaar is of die afkomstig is van andere openbare bronnen om AI-modellen van Google te helpen trainen en functies zoals Google Translate, Bard en Cloud AI uit te bouwen."

Voorheen verzamelde Google ook al openbaar beschikbare informatie op internet, maar toen voor het trainen van 'taalmodellen', zonder specifieke producten of diensten te noemen. Nu is het gebruik verduidelijkt naar alle AI, en worden dus zaken als de chatbot Bard en Cloud AI specifiek genoemd.

Alle openbare informatie?

Google maakt met deze verduidelijking van zijn beleid nog maar eens helder dat openbaar op internet ook echt openbaar is. Tot nu toe betekende dat vooral dat alle mensen kunnen lezen wat jij hebt geschreven. Maar met de opkomst van kunstmatige intelligentie betekent het dat ook die AI alles zal kunnen lezen. En als het openbaar is, zal AI het gebruiken om zichzelf te verbeteren.

Google noemt nieuwsartikelen en telefoongidsen als voorbeelden van openbaar beschikbare bronnen. Openbaar is echter een vrij breed begrip. Een echte vuistregel is er niet, maar als jij de informatie via een zoekmachine kan vinden en lezen, gaat het waarschijnlijk om openbare informatie.

Tegengas van auteursrechthouders

Die nieuwe werkelijkheid wringt op sommige plaatsen wel. Zo willen platforms als Twitter en Reddit graag geld verdienen aan alle openbare berichten die hun gebruikers al jarenlang gratis plaatsen. Die platforms worden sinds kort daarom steeds iets meer afgeschermd, lang niet altijd zonder commentaar.

Het begrip openbaar is voor kunstmatige intelligentie ook niet altijd even helder. Data zijn data voor AI, en alles wordt binnengehaald. Ook auteursrechtelijk materiaal wordt daarbij soms binnengehaald. Dat heeft al geleid tot rechtszaken: van kunstenaars bijvoorbeeld, of van een grote groep Amerikaanse media. En beeldbank Getty zag zijn eigen watermerk terug in beelden die door AI-platform Stable Diffusion werden gegenereerd.

Luister ook onze podcast: