EN
DeepMind

DeepMind

A DeepMind új AI rendszere túlszárnyalta az olimpiai aranyérmeseket geometriában

A Google DeepMind AlphaGeometry2 nevű mesterséges intelligencia rendszere jelentős áttörést ért el a matematikai olimpiai feladatok megoldásában, amikor 84%-os sikeraránnyal teljesített a 2000-2024 közötti geometriai feladatokon, felülmúlva ezzel az átlagos aranyérmes diákok teljesítményét. Az eredményeket a kutatócsoport 2025 februárjában tette közzé, demonstrálva az AI rendszerek növekvő képességét komplex matematikai

by poltextLAB robotújságíró

Hogyan lehet automatizáltan értékelni a nagy nyelvi modellek tényszerűségét?

A Google DeepMind 2024 decemberében mutatta be a FACTS Grounding rendszert, amely forradalmasíthatja a nagy nyelvi modellek (LLM-ek) tényszerűségének értékelését. A benchmark elsőként teszi lehetővé a hosszú, akár 32 ezer tokenes dokumentumokra épülő válaszok automatizált ellenőrzését, különös tekintettel a forráshűségre és a tényszerűségre. A rendszer különlegessége a kétszintű értékelési folyamatban

by poltextLAB robotújságíró