EN

A Google új modellcsaládott mutatott be: a Gemini 2.5 a vállalat eddigi legfejlettebb érvelő modellje

A Google új modellcsaládott mutatott be: a Gemini 2.5 a vállalat eddigi legfejlettebb érvelő modellje
Kép: Unslash - Pawel Czerwinski

A Google 2025. március 25-én mutatta be a Gemini 2.5 mesterségesintelligencia-modellcsaládot, amely a vállalat eddigi legfejlettebb érvelő AI rendszere. Az első kiadott verzió, a Gemini 2.5 Pro Experimental, amely képes érvelni válaszadás előtt, jelentősen javítva ezzel a teljesítményt és pontosságot. A modell már elérhető a Google AI Studio fejlesztői platformon és a Gemini Advanced előfizetők számára a Gemini alkalmazásban.

A Gemini 2.5 Pro kiemelkedő teljesítményt nyújt számos teljesítménymérő teszten, különösen a programozás és komplex problémamegoldás területén. Kódszerkesztési képességét mérő Aider Polyglot teszten 68,6%-os eredményt ért el, felülmúlva versenytársait. A szoftverfejlesztési képességeket vizsgáló SWE-bench Verified teszten 63,8%-ot ért el, ami jobb az OpenAI o3-mini (49,3%) és a kínai DeepSeek R1 (49,2%) teljesítményénél, de elmarad az Anthropic Claude 3.7 Sonnet 70,3%-os eredményétől. A tudományos és érvelési képességeket vizsgáló Humanity's Last Exam teszten 18,8%-os értéket ért el, ami szintén vezető eredmény. Koray Kavukcuoglu, a Google DeepMind műszaki igazgatója szerint a Gemini 2.5 modellek képesek gondolataikon keresztül érvelni a válaszadás előtt, ami fokozott teljesítményt és javított pontosságot eredményez.

Forrás: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-pro

A Gemini 2.5 Pro 1 millió tokenes kontextusablakkal érkezik, ami lehetővé teszi körülbelül 750 000 szó – például a teljes Gyűrűk Ura könyvsorozat hosszánál is terjedelmesebb szöveg – egyidejű feldolgozását, és a Google bejelentése szerint ez hamarosan 2 millió tokenre bővül. A modell különösen erős webalkalmazások létrehozásában és autonóm kódgenerálásban – egyetlen soros utasításból képes végrehajtható videójáték-kódot előállítani. A technológia natív multimodalitással rendelkezik, ami lehetővé teszi szöveg, hang, kép, videó és teljes kódtárak feldolgozását. A Google közlése szerint a jövőben minden új AI modelljükben alapértelmezett funkcióként szerepelnek majd ezek az érvelési képességek, hogy támogassák az összetettebb, környezetükre reagáló, önállóbb AI-rendszereket. Bár a konkrét API árazást még nem hozták nyilvánosságra, a vállalat ígérete szerint a következő hetekben közzéteszik az árazási struktúrát, amely magasabb rátakorlátokat tesz lehetővé a nagyüzemi használathoz.

Források:

1.

Google unveils a next-gen family of AI reasoning models | TechCrunch
Google has unveiled Gemini 2.5, the company’s new family of AI reasoning models that will pause to ‘think’ before answering.

2.

Gemini 2.5: Our most intelligent AI model
Gemini 2.5 is our most intelligent AI model, now with thinking.

3.

Gemini
Gemini 2.5 is our most intelligent AI model, capable of reasoning through its thoughts before responding, resulting in enhanced performance and improved accuracy.