OpenAI komt met lichtere, goedkope versie GPT-4o, 'moet AI toegankelijker maken'

©OpenAI

19 juli om 10:44

Floris Poort
Redacteur

OpenAI komt met een antwoord op de lichtgewicht versies van taalmodellen die Google en Anthropic uitbrachten. GPT-4o Mini is kleiner, zuiniger en goedkoper.

De lichtere en goedkopere versie van GPT-4o is vooral gericht op ontwikkelaars, die willen rommelen met de mogelijkheden van het taalmodel. Want gebruik je dit soort AI-tools om zelf apps te bouwen, kunnen de gebruikskosten snel oplopen. Wie dat niet kan betalen, komt al snel buitenspel te staan en om dat te voorkomen kwamen OpenAI-concurrenten al met lichtere en goedkopere versies.

Google heeft Gemini 1.5 Flash en Anthropic heeft Claude 3: ook kleinere modellen met vergelijkbare kwaliteiten als de grotere versies, maar tegen lagere kosten. OpenAI doet dat nu ook met GPT-4o Mini, dat beduidend lager geprijsd is. Een ander voordeel is de efficiëntie van kleine modellen, die soms klein genoeg zijn om lokaal op een apparaat te werken in plaats van op een server. Die efficiëntie brengt de kosten sterk omlaag: AI kost veel stroom en data en dat is niet gratis.

Hoeveel goedkoper is het dan?

Ontwikkelaars betalen per 1 miljoen tokens: stukjes woord – 1000 tokens staat voor zo'n 750 woorden. Voor GPT-4o betaal je 5 dollar per 1 miljoen input tokens en 15 dollar per 1 miljoen output tokens, of de helft als je grootafnemer bent. Dat loopt alsnog snel op als je een eigen toepassing met OpenAI ontwikkelt, en dus misschien niet eens de volledige mogelijkheden van GPT-4 nodig hebt.

De mini-versie daarentegen kost 0,150 dollar per 1 miljoen input tokens, en 0,60 dollar per 1 miljoen output tokens, of de helft voor grootafnemers: ruim 95 procent goedkoper dus. "Ik denk dat het erg populair wordt", aldus Olivier Godement van OpenAI. "Zowel door bestaande apps die alle AI bij OpenAI gebruiken als door veel apps die eerder door de prijzen buitenspel stonden."

Hoe snel is het?

De mogelijkheden van AI vergelijken blijft lastig, maar er worden verschillende benchmarks voor gebruikt, zoals Measuring Massive Multitask Language Understanding (MMLU). Het nieuwe mini-model van GPT-4o scoort 82 procent bij MMLU, waar het volledige GPT-4o 88,7 procent scoort. GPT-3.5 haalde 70 procent, Claude 3 Haiku scoort 75,2 procent en Gemini 1.5 Flash haalt 78,9 procent. Google's Gemini Ultra scoort daar nu het hoogst met 90 procent. Zo'n score is indicatief, maar natuurlijk niet absoluut wat betreft de mogelijkheden van een model.

Het mini-model van GPT-4o ondersteunt tekst en visie en kan ook multimodale input verwerken, zoals audio en video. Zo nadert het model de mogelijkheden van een volledige virtuele assistent, al blijft het gericht op simpele taken.

Meer kunstmatige intelligentie en mis niets met onze Bright-app.