Google: AI-model dat duizend talen begrijpt komt eraan
Google zegt 'belangrijke vooruitgang' te hebben geboekt bij de ontwikkeling van een AI-taalmodel dat duizend verschillende talen moet kunnen begrijpen.
Google-onderzoekers schrijven over de ontwikkeling van het Universal Speech Model (USM), een taalmodel met kunstmatige intelligentie (AI) dat uiteindelijk duizend van 's werelds meest gesproken talen moet gaan begrijpen. USM is een collectie van taalmodellen met 2 miljard parameters en is getraind met 12 miljoen uur spraak en 28 miljard zinnen in ruim 300 talen.
Het systeem herkent automatisch talen en kan ze in een andere talen vertalen. Voor het onderzoek is USM op YouTube getest om ondertitels bij video’s te genereren. Het systeem ondersteunt nu al ruim honderd talen. Daarmee is volgens Google de basis gelegd, waarna het model verder moet worden uitgebreid naar duizend talen. In totaal zijn er naar schatting wereldwijd zevenduizend 'levende' talen.
Kleine talen beter herkennen
De onderzoekers zeggen dat het systeem nu beter 'ondervertegenwoordigde talen' kan herkennen, waarvoor er minder handmatige gelabelde gegevens nodig zijn. "Ook is ons proces om het model te trainen effectief in het aanpassen aan nieuwe talen en gegevens."
Live vertalen met slimme bril
Google zou het AI-taalmodel naast voor Google Translate ook kunnen gebruiken voor live-vertalingen in een toekomstige bril met augmented reality (AR). Daarvan liet Google vorig jaar een concept zien. Het zoekbedrijf zou in 2024 een nieuwe slimme bril op de markt willen brengen.
Google presenteerde onlangs ook een eerste testversie van zijn AI-chatbot Bard die vragen van gebruikers moet gaan beantwoorden, een reactie op de populaire chatbot ChatGPT. Tijdens zijn jaarlijkse ontwikkelaarscongres Google I/O in mei zal het bedrijf waarschijnlijk nog meer AI-innovaties aankondigen.
Concurrent Meta, het moederbedrijf van Facebook, werkt aan een soortgelijk AI-vertaalsysteem, dat momenteel al 200 talen live kan herkennen. Meta noemde dat vorig jaar 'een doorbraak in hoogwaardige machinevertaling'.