Deze vertaaltool van Meta ondersteunt spraak in 100 talen: 'Belangrijke doorbraak'
Techreus Meta heeft dinsdag een demo van zijn nieuwe vertaalsoftware gelanceerd die gesproken en tekstuele input kan vertalen. De AI, SeamlessM4T genaamd, ondersteunt bijna 100 talen.
De software kan bijna 100 geschreven en gesproken talen herkennen en naar tekst vertalen. Output naar spraak is beschikbaar in 36 talen. Ook kan SeamlessM4T verschillende talen binnen eenzelfde zin herkennen en vertalen.
SeamlessM4T is beschikbaar op GitHub, Hugging Face en kan ook online getest worden op de website van Meta. Het bedrijf maakt de software beschikbaar onder de Creative Commons CC BY-NC 4.0-licentie, waardoor andere partijen erop kunnen verderbouwen.
Universele vertaler
Het bedrijf van Mark Zuckerberg kondigde vorig jaar al aan dat het een universele vertaler wil bouwen. In een persbericht zegt Meta nu dat SeamlessM4T een stap vooruit is, maar dat 'het bouwen van een universele vertaler, zoals de fictieve Babel Fish in The Hitchhiker’s Guide to the Galaxy, een uitdaging is omdat bestaande spraak-naar-spraak en spraak-naar-tekst systemen slechts een klein deel van de talen in de wereld dekken'.
Hoewel een universele vertaler dus nog niet meteen zal verschijnen, noemt Meta dit een 'belangrijke doorbraak'. Het grote verschil met andere taalmodellen is dat SeamlessM4T een vertaling in één keer uitvoert, in tegenstelling tot andere modellen die de vertaling verdelen onder verschillende systemen.
Nodig om content te modereren
De tool zal waarschijnlijk gebruikt worden om content op dochterbedrijven als Facebook en Instagram te modereren. Momenteel is het immers niet evident om content in verschillende talen te modereren met behulp van AI. De meeste AI-tools worden vooral getraind op data van de grote wereldtalen, maar beschikken over minder grote datasets om talen als Telugu of Swahili te herkennen.
SeamlessM4T is ook getraind om 'toxische' woorden te herkennen, woorden die haat, geweld of andere negatieve zaken kunnen aanmoedigen. Ook beweert Meta dat het model vooroordelen op basis van gender kan herkennen.