EN

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában
Kép: Freepik - katemangostar

A Google DeepMind AlphaGeometry2 nevű mesterséges intelligencia rendszere jelentős áttörést ért el a matematikai olimpiai feladatok megoldásában, amikor 84%-os sikeraránnyal teljesített a 2000-2024 közötti geometriai feladatokon, felülmúlva ezzel az átlagos aranyérmes diákok teljesítményét. Az eredményeket a kutatócsoport 2025 februárjában tette közzé, demonstrálva az AI rendszerek növekvő képességét komplex matematikai problémák megoldásában.

Az új rendszer jelentősen felülmúlta elődjét, az AlphaGeometry-t, amely 54%-os megoldási arányt ért el ugyanezen a feladathalmazon. Az AlphaGeometry2 az 50 olimpiai geometriai feladatból 42-t oldott meg sikeresen, míg az átlagos aranyérmes diák 40,9 feladatot old meg. A fejlesztés kulcsa a Gemini nyelvi modell integrációja volt, valamint olyan új képességek bevezetése, mint a geometriai objektumok síkbeli mozgatása és a lineáris egyenletek megoldása. Kevin Buzzard, az Imperial College London matematikusa szerint nem lesz hosszú idő, mire a számítógépek maximális pontszámot érnek el a Nemzetközi Matematikai Olimpián (IMO).

A fennmaradó megoldatlan feladatok két fő kategóriába sorolhatók: A rendszer jelenlegi formájában nem tud kezelni 6 olyan problémát, amelyek a nyelvi modell korlátai miatt nem formalizálhatók, illetve 2 olyan feladatot (IMO 2018 P6, IMO 2023 P6), amelyek olyan fejlett geometriai problémamegoldó technikákat igényelnek, mint az inverzió, a projektív geometria vagy a radikális tengely. Ezeknek a problémáknak a megoldása hosszabb következtetési időt, hosszabb bizonyításokat és több segédkonstrukciót igényelnének.

Források:

1.

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

2.

DeepMind AI crushes tough maths problems on par with top human solvers
The company’s AlphaGeometry 2 reaches the level of gold-medal students in the International Mathematical Olympiad.

3.

DeepMind AI achieves gold-medal level performance on challenging Olympiad math questions
A team of researchers at Google’s DeepMind project, reports that its AlphaGeometry2 AI performed at a gold-medal level when tasked with solving problems that were given to high school students participating in the International Mathematical Olympiad (IMO) over the past 25 years. In their paper posted on the arXiv preprint server, the team gives an overview of AlphaGeometry2 and its scores when solving IMO problems.