Grote doorbraak met AI: 'Even goed in wiskunde als de grootste genieën'
Een Amerikaanse student heeft een AI-model ontwikkeld dat even goed presteert als de beste deelnemers van de Internationale Wiskunde Olympiade in de categorie meetkunde.
Trieu Trinh, een net afgestudeerde student aan New York University, heeft de afgelopen vier jaar AlphaGeometry ontwikkeld. Deze AI kan diverse moeilijke meetkundige problemen oplossen. Volgens Trinh, die zijn werk in vakblad Nature publiceerde, presteert het programma op het niveau van de beste deelnemers aan de Wiskunde Olympiade.
De computerwetenschappers ontwikkelde het systeem niet in zijn eentje. Van 2021 tot 2023 werkte hij bij Google om AlphaGeometry te ontwikkelen, meer bepaald bij DeepMind, de AI-ontwikkelingstak van Google. DeepMind ontwikkelde eerder al onder andere AlphaGo en AlphaZero, programma’s die respectievelijk het spel Go en schaak kraakten.
'We maken een grote sprong'
Wiskundige problemen zijn echter een hardere noot om te kraken. Trinh vertelde aan de New York Times dat hij lang moeite had om AlphaGeometry aan de praat te krijgen. Uiteindelijk lukte dat. "We maken geen stapsgewijze verbetering. We maken een grote sprong, een grote doorbraak in termen van resultaat", zegt hij in de Amerikaanse krant.
AlphaGeometry is nu in staat om willekeurige meetkundige vragen van de Wiskunde Olympiade op te lossen. Uit 30 vragen kon het programma er 25 oplossen. Ter vergelijking: menselijke winnaars van de Wiskunde Olympiade slagen erin om gemiddeld 25,9 vragen op te lossen. De zilveren en bronzen medailles gaan respectievelijk naar mensen die gemiddeld 22,9 en 19,3 scoren.
Menselijk denken
Volgens Trinh en de andere auteurs van de paper is AlphaGeometry 'een opmerkelijke mijlpaal in geautomatiseerd redeneren op menselijk niveau'.
Andere AI-tools die het voorbije jaar populair werden, zoals ChatGPT van OpenAI, zijn niet in staat om logisch te redeneren. Een kanttekening is wel dat AlphaGeometry specifiek voor Olympiadevragen werd ontwikkeld en niet zomaar wiskundigen kan vervangen.