EN

A Google DeepMind bemutatta a Genie 3-at: új világmodell a mesterséges általános intelligencia felé vezető úton

A Google DeepMind bemutatta a Genie 3-at: új világmodell a mesterséges általános intelligencia felé vezető úton
Forrás: pixabay - geralt

A Google DeepMind 2025. augusztus 5-én mutatta be a Genie 3-at, az első valós idejű interaktív általános célú világmodellt, amely szöveges utasításból képes többperces 3D környezeteket generálni. A kutatócsoport szerint ez a technológia kulcsfontosságú lépést jelent a mesterséges általános intelligencia (AGI) felé vezető úton, mivel korlátlan szimulációs környezetet biztosít AI ügynökök képzéséhez.

A Genie 3 jelentős technikai áttörést képvisel elődjéhez, a Genie 2-höz képest, amely mindössze 10-20 másodperces környezeteket tudott létrehozni. Jack Parker-Holder, a DeepMind kutatója szerint az új modell megtestesült ügynökök számára teszi lehetővé a valós világbeli forgatókönyvek szimulálását, ami különösen nagy kihívást jelent. A modell auto-regresszív architektúrája lehetővé teszi, hogy emlékezzen a korábban generált tartalomra, így akár egy perccel korábbi információkra is visszatekinthet a konzisztencia fenntartása érdekében. Shlomi Fruchter kutatási igazgató hangsúlyozta, hogy a Genie 3 túlmutat a korábbi szűk világmodelleken, mivel nem kötődik egyetlen környezethez sem, és mind fotorealisztikus, mind képzeletbeli világokat képes létrehozni.

A Genie 3 alkalmazási lehetőségei az oktatástól a játékfejlesztésig terjednek, azonban a kutatók elsősorban az AI ügynökök általános célú feladatokra való képzésében látják a valódi áttörést. A modell korlátozott előzetes verzióban érhető el, és a Google DeepMind kis számú akadémikus és alkotó számára biztosít korai hozzáférést a technológiához. Az egyes korlátok között szerepel a korlátozott akciótér, a több független ügynök közötti interakció modellezésének nehézségei, valamint az, hogy jelenleg csak néhány perc folyamatos interakciót támogat az órákig tartó képzéshez szükséges időtartam helyett.

Források:

DeepMind thinks its new Genie 3 world model presents a stepping stone toward AGI | TechCrunch
Google DeepMind has revealed Genie 3, its latest foundation world model that the AI lab says presents a crucial stepping stone on the path to artificial general intelligence, or human-like intelligence.
Genie 3: A New Frontier for World Models
Today we are announcing Genie 3, a general purpose world model that can generate an unprecedented diversity of interactive environments. Given a text prompt, Genie 3 can generate dynamic worlds…
Google Genie 3: DeepMind Unveils A New AI Model | Ultralytics
DeepMind’s Genie 3 AI world model converts text or image prompts into 3D environments. This advancement marks another step toward human‑like intelligence.