EN

A Google elindította a Gemini Deep Think AI-t, amely párhuzamosan tesztel több ötletet

A Google elindította a Gemini Deep Think AI-t, amely párhuzamosan tesztel több ötletet
Source: Getty Images For Unsplash+

A Google DeepMind 2025. augusztus 1-jén kiadta a Gemini 2.5 Deep Think modellt, amely a vállalat eddigi legfejlettebb AI érvelési rendszere, és képes párhuzamosan több ötletet létrehozni és értékelni, mielőtt kiválasztaná a legjobb megoldást. Ez a többügynökös rendszer, amely először a 2025. májusi Google I/O eseményen került bemutatásra, jelentősen több számítási erőforrást használ, mint a hagyományos AI modellek, és mostantól elérhető a Google havi 250 dolláros Ultra előfizetői számára.

A Gemini 2.5 Deep Think kiemelkedő teljesítményt nyújt kulcsfontosságú teszteken, elérve 34,8%-ot a Humanity's Last Exam (HLE) vizsgán eszközök nélkül, szemben az xAI Grok 4 25,4%-os és az OpenAI o3 20,3%-os eredményével, valamint 87,6%-ot a LiveCodeBench 6 kódolási teszten, megelőzve a Grok 4 79%-os és az OpenAI o3 72%-os teljesítményét. A Google egy továbbfejlesztett változatot is kifejlesztett, amely aranyérmes szintet ért el az idei Nemzetközi Matematikai Olimpián (IMO), és ezt a változatot, amely órákig dolgozik egy-egy komplex probléma megoldásán, kiválasztott matematikusok és tudósok szűk csoportjával osztják meg további kutatási célokra. A vállalat újszerű megerősítéses tanulási technikákat is alkalmazott, hogy a modell hatékonyabban használja érvelési útvonalait.

A Gemini Deep Think automatikusan együttműködik olyan eszközökkel, mint a kódfuttatás és a Google Keresés, valamint a vállalat szerint sokkal hosszabb válaszokat képes generálni, mint a hagyományos AI modellek. A Google a következő hetekben tervezi megosztani a Gemini 2.5 Deep Thinket válogatott tesztelőkkel a Gemini API-n keresztül, hogy jobban megértse, hogyan használhatják a fejlesztők és vállalatok ezt a többügynökös rendszert. Ez a fejlesztés egy szélesebb iparági trendet tükröz, mivel több vezető AI laboratórium – köztük az xAI és az OpenAI – is a többügynökös megközelítés felé konvergál, de a magas számítási költségek miatt ezek a rendszerek várhatóan a legdrágább előfizetési csomagok mögött maradnak.

Források:

Google rolls out Gemini Deep Think AI, a reasoning model that tests multiple ideas in parallel | TechCrunch
Google released its first publicly available “multi-agent” AI system, which uses more computational resources, but produces better answers.
Try Deep Think in the Gemini app
Deep Think utilizes extended, parallel thinking and novel reinforcement learning techniques for significantly improved problem-solving.
Google rolls out its most powerful Gemini model yet
Google is rolling out its most advanced version of Gemini yet, called Deep Think. It’s available exclusively to AI Ultra subscribers on the Gemini app.