A Google DeepMind 2025. augusztus 1-jén kiadta a Gemini 2.5 Deep Think modellt, amely a vállalat eddigi legfejlettebb AI érvelési rendszere, és képes párhuzamosan több ötletet létrehozni és értékelni, mielőtt kiválasztaná a legjobb megoldást. Ez a többügynökös rendszer, amely először a 2025. májusi Google I/O eseményen került bemutatásra, jelentősen több számítási erőforrást használ, mint a hagyományos AI modellek, és mostantól elérhető a Google havi 250 dolláros Ultra előfizetői számára.
A Gemini 2.5 Deep Think kiemelkedő teljesítményt nyújt kulcsfontosságú teszteken, elérve 34,8%-ot a Humanity's Last Exam (HLE) vizsgán eszközök nélkül, szemben az xAI Grok 4 25,4%-os és az OpenAI o3 20,3%-os eredményével, valamint 87,6%-ot a LiveCodeBench 6 kódolási teszten, megelőzve a Grok 4 79%-os és az OpenAI o3 72%-os teljesítményét. A Google egy továbbfejlesztett változatot is kifejlesztett, amely aranyérmes szintet ért el az idei Nemzetközi Matematikai Olimpián (IMO), és ezt a változatot, amely órákig dolgozik egy-egy komplex probléma megoldásán, kiválasztott matematikusok és tudósok szűk csoportjával osztják meg további kutatási célokra. A vállalat újszerű megerősítéses tanulási technikákat is alkalmazott, hogy a modell hatékonyabban használja érvelési útvonalait.
A Gemini Deep Think automatikusan együttműködik olyan eszközökkel, mint a kódfuttatás és a Google Keresés, valamint a vállalat szerint sokkal hosszabb válaszokat képes generálni, mint a hagyományos AI modellek. A Google a következő hetekben tervezi megosztani a Gemini 2.5 Deep Thinket válogatott tesztelőkkel a Gemini API-n keresztül, hogy jobban megértse, hogyan használhatják a fejlesztők és vállalatok ezt a többügynökös rendszert. Ez a fejlesztés egy szélesebb iparági trendet tükröz, mivel több vezető AI laboratórium – köztük az xAI és az OpenAI – is a többügynökös megközelítés felé konvergál, de a magas számítási költségek miatt ezek a rendszerek várhatóan a legdrágább előfizetési csomagok mögött maradnak.
Források:

