Harry Potter-boeken blijken magisch middel voor AI-onderzoek
Voor onderzoekers van generatieve kunstmatige intelligentie, is de juiste dataset van essentieel belang. Steeds vaker wordt daar de Harry Potter-reeks van J.K. Rowling voor gebruikt.
Onderzoekers van Microsoft hebben een techniek ontwikkeld om AI-modellen specifieke informatie te doen vergeten, zonder dat het hele model opnieuw getraind hoeft te worden. Het resultaat staat in de paper 'Who's Harry Potter?', omdat voor het onderzoek de boeken van J.K. Rowling is gebruikt.
Met deze techniek kan onder andere auteursrechtelijk beschermde content verwijderd worden uit de dataset van een AI-model. Dat werd in het onderzoek aangetoond, door het AI-model personages en plotpunten uit Harry Potter te laten vergeten.
De onderzoekers hebben hiervoor deze boeken gebruikt, omdat het bekend materiaal is. Het is daarom makkelijk voor iedereen om te controleren of bepaalde informatie toch nog opduikt.
Meer magisch onderzoek
Ook bij andere AI-onderzoeken worden de beroemde boeken ingezet. Bijvoorbeeld bij de samenwerking tussen de Universiteit van Washington, Universiteit van Californië en de Allen Insitute bij het maken van AI-model Silo, waarmee gekeken wordt wat het verwijderen van specifieke data voor effect heeft op het AI-model.
In dit geval merkten de onderzoekers dat het AI-model niet zo goed presteerde met enkel publiekelijk beschikbaar materiaal, dus werd de dataset aangevuld met de Harry Potter-boeken. Toen bleek dat als je één boek uit de Harry Potter-reeks verwijdert, de nauwkeurigheid van het AI-model direct enorm achteruit gaat.
Als kind gelezen
Wat maakt deze reeks over een magische leerling dan zo geschikt voor onderzoek? "De overvloed aan scènes, dialogen en emotionele momenten maakt het zeer relevant", vertelt onderzoeker Leila Wehbe tegenover Bloomberg. Wehbe denkt dat de boeken ook vaak gekozen worden, omdat jongere onderzoekers deze als kinderen hebben gelezen.
Mis niks, volg ons WhatsApp-kanaal of abonneer je op de Bright Daily nieuwsbrief.