A Google 2025. március 25-én mutatta be a Gemini 2.5 mesterségesintelligencia-modellcsaládot, amely a vállalat eddigi legfejlettebb érvelő AI rendszere. Az első kiadott verzió, a Gemini 2.5 Pro Experimental, amely képes érvelni válaszadás előtt, jelentősen javítva ezzel a teljesítményt és pontosságot. A modell már elérhető a Google AI Studio fejlesztői platformon és a Gemini Advanced előfizetők számára a Gemini alkalmazásban.
A Gemini 2.5 Pro kiemelkedő teljesítményt nyújt számos teljesítménymérő teszten, különösen a programozás és komplex problémamegoldás területén. Kódszerkesztési képességét mérő Aider Polyglot teszten 68,6%-os eredményt ért el, felülmúlva versenytársait. A szoftverfejlesztési képességeket vizsgáló SWE-bench Verified teszten 63,8%-ot ért el, ami jobb az OpenAI o3-mini (49,3%) és a kínai DeepSeek R1 (49,2%) teljesítményénél, de elmarad az Anthropic Claude 3.7 Sonnet 70,3%-os eredményétől. A tudományos és érvelési képességeket vizsgáló Humanity's Last Exam teszten 18,8%-os értéket ért el, ami szintén vezető eredmény. Koray Kavukcuoglu, a Google DeepMind műszaki igazgatója szerint a Gemini 2.5 modellek képesek gondolataikon keresztül érvelni a válaszadás előtt, ami fokozott teljesítményt és javított pontosságot eredményez.

A Gemini 2.5 Pro 1 millió tokenes kontextusablakkal érkezik, ami lehetővé teszi körülbelül 750 000 szó – például a teljes Gyűrűk Ura könyvsorozat hosszánál is terjedelmesebb szöveg – egyidejű feldolgozását, és a Google bejelentése szerint ez hamarosan 2 millió tokenre bővül. A modell különösen erős webalkalmazások létrehozásában és autonóm kódgenerálásban – egyetlen soros utasításból képes végrehajtható videójáték-kódot előállítani. A technológia natív multimodalitással rendelkezik, ami lehetővé teszi szöveg, hang, kép, videó és teljes kódtárak feldolgozását. A Google közlése szerint a jövőben minden új AI modelljükben alapértelmezett funkcióként szerepelnek majd ezek az érvelési képességek, hogy támogassák az összetettebb, környezetükre reagáló, önállóbb AI-rendszereket. Bár a konkrét API árazást még nem hozták nyilvánosságra, a vállalat ígérete szerint a következő hetekben közzéteszik az árazási struktúrát, amely magasabb rátakorlátokat tesz lehetővé a nagyüzemi használathoz.
Források:
1.
2.
3.