'Photoshop voor stemmen'

Software doet flirtende vrouw na: de film Her in het echt?

© Sonantic

flirten stem AI flirt
17 februari 2022 om 15:02
Laatste update: 17 februari 2022 om 15:03

Softwarebedrijf Sonantic zegt kunstmatige stemmen nog realistischer te maken. Met behulp van kunstmatige intelligentie (AI) is een flirtende vrouwenstem nagebootst, inclusief subtiele spraakelementen.

Audio-deepfakes, met software nagemaakte stemmen, worden steeds beter. Dat bewijst een nieuwe video van het bedrijf Sonantic. De synthetische stem kan lachen, flirten, zuchten en zelfs met de kijker spotten. 

Volgens Sonantic ligt de sleutel tot authentiek klinkende stemmen in het nabootsen van kleine non-verbale elementen, zoals pauzes om in te ademen. Dat zou ervoor zorgen dat een AI meer als een echte persoon klinkt. "Doel was om subtielere emoties na te bootsen. Grote emoties zijn makkelijker,” aldus John Flynn, CTO en medeoprichter van het bedrijf.

In de video zien kijkers een menselijke actrice maar de bijbehorende voice-over is volledig kunstmatig. Met het filmpje wil Sonantic tonen hoe de technologie gebruikt kan worden om 'hyper-realistische romantische ontmoetingen' na te bootsen. De video doet ook denken aan de sciencefiction-film Her over een virtuele assistent.

De software is het beste te omschrijven als 'Photoshop voor stemmen', stelt ceo Zeena Qureshi. Gebruikers moeten eerst een tekst ingeven, waarna ze kunnen kiezen welke emoties de AI zal tonen. Daarna kunnen ze kiezen uit een reeks verschillende stemmen die gebaseerd zijn op de stem van een echte persoon.

Eerdere versies van de software konden al basisemoties vertonen, zoals angst en vreugde. Sinds deze week komen daar subtielere stemmingen bij, zoals flirterig en speels. Bovendien kunnen gebruikers met een 'director mode' details aanpassen zoals de intensiteit van de uitspraken. Ook kunnen ze met die modus niet-verbale elementen toevoegen.

Niet de enige speler

Sonantic is niet het eerste bedrijf dat AI-gegenereerde stemmen aanbiedt. Zo biedt het bedrijf Descript een vergelijkbare dienst aan. Een andere concurrent is Speak AI. Volgens Sonantic hebben de concurrenten niet zo veel mogelijkheden om een stem aan te passen.

The Verge was echter sceptisch over het promotiefilmpje. Om die reden vroeg het aan Sonantic om wat samples door te sturen van rauwe, onbewerkte zinnetjes die door de AI werden ingesproken. Daaruit valt meteen af te leiden dat het om een AI gaat, een groot verschil met het gepolijste filmpje dat Sonantic uitbracht. Daaruit blijkt dat de software toch nog een weg te gaan heeft voordat het volledig realistische stemmen kan nabootsen. 

Acteurs mogelijk vervangen

De technologie klinkt veelbelovend. Zo zouden stemacteurs in tv-series en games in de toekomst vervangen kunnen worden door AI. Ook stemassistenten zouden steeds beter kunnen worden met behulp van de technologie. Sonantic kondigde alvast aan samen te zullen werken met Mercedes, om de stemassistent van het EQXX-concept expressiever te maken. 

Maar er zijn ook minder positieve voorbeelden. Zo deden criminelen in 2019 de stem van de ceo van een Brits bedrijf na om zo’n 220.000 euro buit te maken. Het slachtoffer van de truc zei toen het 'lichte Duitse accent en de melodie van de stem' van de topman te herkennen. 

Bekijk ook: