Deze nieuwe AI-tool maakt stemmen feilloos na

©Unsplash

29 maart 2024 om 20:43

Dwayne Vrancken
Redacteur

OpenAI, bekend van ChatGPT, werkt aan een nieuw AI-model dat stemmen namaakt. De tool heet Voice Engine en heeft slechts vijftien seconden van iemands stem nodig om er een AI-versie van te maken.

Het bedrijf kwam vandaag naar buiten met de eerste resultaten van een test met Voice Engine. Twee jaar lang werd het model, een uitbreiding van OpenAI's huidige text-to-speech API, getraind om een echte voorbeeldstem na te bootsen. Dat gebeurde in samenwerking met verschillende bedrijven, waaronder het digitale onderwijsplatform Age of Learning en communicatiesoftwarebedrijf Livox.

Op zijn eigen website laat OpenAI horen wat de mogelijke toepassingen zijn van Voice Engine. Zo kan het model worden gebruikt voor hulp bij lezen voor mensen met laaggeletterdheid en kinderen, als communicatiemiddel voor mensen met een beperking, maar ook bij vertalingen.

OpenAI zegt in een interview met TechCrunch ook dat Spotify gebruikmaakt van de technologie bij het dubben van populaire podcasts in andere talen.

Potentie en risico's in kaart brengen

Je hoeft er echter niet op te rekenen dat je binnenkort zelf aan de slag kan met Voice Engine. OpenAI brengt eerst een preview-versie van het model uit en er is nog geen datum voor een openbare release. Het bedrijf wil de tijd nemen om te onderzoeken hoe het model gebruikt en mogelijk misbruikt kan worden.

"We erkennen dat generatieve spraak gebaseerd op de stemmen van mensen serieuze risico's heeft, die extra relevant zijn in een verkiezingsjaar", schrijft OpenAI op zijn website. Het bedrijf verwijst naar de komende presidentsverkiezingen in de Verenigde Staten op 5 november.

Eerder deze week lieten we je in een nieuwe video zien hoe onze presentator Eric zichzelf heeft vervangen door AI. Hij gebruikte daarvoor ook meerdere tools om zijn stem na te bootsen.

Lees meer nieuws over AI en blijf op de hoogte met onze nieuwsbrief.