A Google 2025. március 12-én bemutatta a Gemma 3 nevű nyílt forráskódú mesterséges intelligencia modellcsaládját, amely Gemini 2.0 modelleken alapuló technológiát használ, és kivételes teljesítményt nyújt egyetlen GPU vagy TPU eszközön futtatva. A modell kiemelkedő képességei között szerepel a 140 nyelv támogatása, a 128 ezer tokenes kontextusablak és az a tény, hogy multimodális funkcióit - beleértve a szöveg- és képelemzést - négy különböző méretben (1B, 4B, 12B és 27B paraméter) kínálja.
A Gemma 3 legnagyobb, 27 milliárd paraméteres változata kiemelkedő, 1338-as Elo-pontszámot ért el a felhasználói preferenciákat mérő LMArena értékelésein, ami a versenytárs DeepSeek R1 modell 1363-as pontszámának 98%-a. A teljesítménykülönbség csekély, azonban a hardverigény terén óriási az eltérés: míg a DeepSeek működtetéséhez 32 Nvidia H100 grafikus kártyára van szükség, addig a Gemma 3 mindössze egyetlen GPU-val is teljes értékűen működik. A Google modelljének hatékonyságát az úgynevezett "desztilláció" nevű mesterséges intelligencia technika biztosítja, továbbá három speciális minőségellenőrzési eljárás javítja a matematikai és programozási képességeit.
A Gemma 3 jelentős előrelépést jelent elődjéhez, a Gemma 2-höz képest, amely csak 8 ezer tokenes kontextusablakkal és kizárólag angol nyelvi támogatással rendelkezett. Az új modell szivárgásvizsgálaton is átesett, amely kimutatta, hogy a Gemma 3 modellek sokkal alacsonyabb arányban memorizálnak hosszú szövegeket, mint a korábbi modellek, ezzel csökkentve az információszivárgás kockázatát. A Google által fejlesztett eszköz további előnye, hogy támogatja a Hugging Face Transformers, Ollama, JAX, Keras, PyTorch és más népszerű eszközöket, valamint azonnali hozzáférést biztosít a Google AI Studio, Kaggle vagy Hugging Face platformokon keresztül.
Források:
1.

2.

3.
