DeepMind Gemini kutatási eredmények

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában

2025. márc. 17.

2 min read

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában — Kép: Freepik - katemangostar

A Google DeepMind AlphaGeometry2 nevű mesterséges intelligencia rendszere jelentős áttörést ért el a matematikai olimpiai feladatok megoldásában, amikor 84%-os sikeraránnyal teljesített a 2000-2024 közötti geometriai feladatokon, felülmúlva ezzel az átlagos aranyérmes diákok teljesítményét. Az eredményeket a kutatócsoport 2025 februárjában tette közzé, demonstrálva az AI rendszerek növekvő képességét komplex matematikai problémák megoldásában.

Az új rendszer jelentősen felülmúlta elődjét, az AlphaGeometry-t, amely 54%-os megoldási arányt ért el ugyanezen a feladathalmazon. Az AlphaGeometry2 az 50 olimpiai geometriai feladatból 42-t oldott meg sikeresen, míg az átlagos aranyérmes diák 40,9 feladatot old meg. A fejlesztés kulcsa a Gemini nyelvi modell integrációja volt, valamint olyan új képességek bevezetése, mint a geometriai objektumok síkbeli mozgatása és a lineáris egyenletek megoldása. Kevin Buzzard, az Imperial College London matematikusa szerint nem lesz hosszú idő, mire a számítógépek maximális pontszámot érnek el a Nemzetközi Matematikai Olimpián (IMO).

A fennmaradó megoldatlan feladatok két fő kategóriába sorolhatók: A rendszer jelenlegi formájában nem tud kezelni 6 olyan problémát, amelyek a nyelvi modell korlátai miatt nem formalizálhatók, illetve 2 olyan feladatot (IMO 2018 P6, IMO 2023 P6), amelyek olyan fejlett geometriai problémamegoldó technikákat igényelnek, mint az inverzió, a projektív geometria vagy a radikális tengely. Ezeknek a problémáknak a megoldása hosszabb következtetési időt, hosszabb bizonyításokat és több segédkonstrukciót igényelnének.

Források:

A Microsoft szerint az AI új toxinokat tervezhet, amelyek kijátsszák a biobiztonsági ellenőrzést

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában

Related Posts

A Microsoft szerint az AI új toxinokat tervezhet, amelyek kijátsszák a biobiztonsági ellenőrzést

Az OpenAI szerint az AI-modellek megtévesztő viselkedése a modellek tanításával visszaszorítható

A Google DolphinGemma AI modellje új lehetőségeket nyit a delfinkommunikáció kutatásában

Az OpenAI bevezette a GDPval mérőszámot: AI-modellek teljesítményének mérése 44 foglalkozás valós feladatain keresztül

Generatív AI-val új porózus oxid anyagokat azonosítottak a jövő energiatárolásához