©Anthropic

AI-model Claude van Anthropic haalt ChatGPT in, gebruikers 'zwaar onder de indruk'

AI-model Claude van Anthropic haalt ChatGPT in, gebruikers 'zwaar onder de indruk'

21 juni om 10:16

AI-taalmodellen zijn constant in een race met elkaar. Claude van Anthropic bewijst dat het zich prima kan meten met grote namen als ChatGPT en Gemini, maar het sorteert wel voor op een specifiekere toepassing.

AI-taalmodellen weten nu al maandenlang te verbazen met hun steeds completere reacties in steeds geloofwaardigere bewoording. En ook wordt het steeds duidelijker waar we deze AI's voor kunnen gebruiken: voor alles van het analyseren van grote bergen data en onderzoek tot het controleren en genereren van programmeertaal. Hoe 'goed' een AI is, ligt natuurlijk deels aan de gebruiker maar er zijn wel benchmarks: tests die je aan verschillende AI's kan voorschotelen om te zien wie het snelst of het meest accuraat is.

Het nieuwe Claude 3.5 Sonnet van Anthropic scoort in een reeks van zulke benchmarks grotendeels sterker dan GPT-4o van OpenAI, Gemini 1.5 Pro van Google en Llama-400b van Meta. In zeven van de negen algemene tests is Claude beter, en ook in vier van de vijf tests rond computer-visie scoort Claude het sterkst. Toch de kanttekening: dit soort tests blijven maar een test en het is bovendien een momentopname. De verschillen tussen de verschillende modellen blijven klein. Zoals wel vaker is het meer de vraag: wat doe je ermee?

Gebruikers onder de indruk

En wat doe je dan zoal met Claude? AI-expert Allie K. Miller liet Claude 3.5 Sonnet een web-versie van het bordspelletje Mancala maken. Ze gaf Claude één screenshot met de regels van het spel, en gaf de opdracht: 'lees dit, programmeer het, maak een web-app en laat die zien'.

Claude gaat direct aan de slag, en laat ook zien wat het doet. Naast het chatveld opent een programmeervenster, zodat je precies ziet waar Claude mee bezig is. Dat is de nieuwe functie 'Artifacts': daarmee kan je als gebruiker zonder Claude te verlaten meteen aan de slag met het resultaat. Zo kun je een gegenereerde tekst alsnog aanpassen en daarna meteen kopiëren, zonder nog een tussenstop te hoeven maken in een andere tekstverwerker.

Hoe dan ook: na die 25 seconden legt Claude in het chatveld precies uit wat het gedaan heeft, en hoe het spel werkt. En rechts daarvan is ook een volledig speelbare versie van het spel Mancala te zien. Miller kan tegen de computer spelen, de code aanpassen of Claude vragen om dat te doen.

Nog een stap verder: een speelbare Super Mario-kloon binnen drie minuten. AI-ondernemer Pietro Schirano laat zien hoe Claude 3.5 in samenwerking met AI-app Maestro op basis van een paar geometrische vormen een korte opdracht een erg simpele maar volledig speelbare Mario-game kan maken.

Claude doet zeker mee in de race

Claude 3.5 Sonnet is dus stukken beter in het herkennen en analyseren van afbeeldingen. Op taalgebied begrijpt de AI complex en genuanceerd taalgebruik beter, inclusief voor AI-ingewikkelde concepten als humor. En met de Artifacts-functie laat Anthropic weer wat beter zien hoe je een AI-chatbot kan gebruiken om makkelijker te werken, zonder dat je zelf als gebruiker steeds heen en weer springt tussen een chatbot en allerlei andere toepassingen.

De sterke prestaties van Claude 3.5 Sonnet zijn ook een voorbode voor nog meer mogelijkheden in het grootste model van Anthropic. Het bedrijf verdeelt zijn modellen in drie groottes: het kleinste model het Haiku, het middelste model heet Sonnet en het grootste heet Opus. Claude 3.5 Sonnet is twee keer sneller dan zijn voorganger en daarmee ook sneller dan Claude 3 Opus.

Claude 3.5 Sonnet is vanaf nu te gebruiken voor iedereen met een gratis Anthropic-account en zit ook in de iOS-app van Claude. Net als bij de concurrenten zit er ook bij de gratis versie van Claude een dagelijkse limiet op het aantal vragen dat je kan stellen.

Meer AI en mis niets met onze Bright-app.