EN

A Google legújabb Gemma 3n modellje innovatív megoldásokkal növeli a mobileszközökön futó AI alkalmazások hatékonyságát

A Google legújabb Gemma 3n modellje innovatív megoldásokkal növeli a mobileszközökön futó AI alkalmazások hatékonyságát
Source: Unsplash - dyno8426

A 2025. június 26-án hivatalosan kiadott Gemma 3n jelentős fejlesztéseket tartalmaz, amelyek kifejezetten a mobilkészülékeken való AI futtatást célozzák. A multimodális modell natívan támogat kép-, hang-, videó- és szöveges bemeneteket, és két méretben érhető el: az E2B (5 milliárd paraméter) és az E4B (8 milliárd paraméter), amelyek mindössze 2GB, illetve 3GB memóriával működnek.

A Gemma 3n középpontjában több úttörő technológia áll, beleértve a MatFormer (Matryoshka Transformer) architektúrát, amely lehetővé teszi a fejlesztők számára kisebb almodellek kinyerését vagy a modell méretének dinamikus beállítását. A Per-Layer Embeddings (PLE) technika 46%-kal csökkenti a szükséges paraméterek számát, míg a KV Cache Sharing 2x-es javulást eredményez a prefill teljesítményben a Gemma 3 4B-hez képest. Az új MobileNet-V5 látórendszer akár 60 képkockát is feldolgozhat másodpercenként egy Google Pixel készüléken, ami 13-szoros gyorsulást jelent kvantálással. A beépített hangelemző rendszer a Universal Speech Model alapján lehetővé teszi a készüléken történő beszédfelismerést és beszédfordítást, jelenleg 30 másodperces hangklipekre korlátozva.

A Gemma 3n az LMArena pontszámban több mint 1300-at ért el, ami az első ilyen eredmény egy 10 milliárd paraméternél kisebb modellnél. A modell 140 nyelvet támogat szövegben és 35 nyelvet multimodális megértésben. Az eredeti Gemma modellcsalád már 160 millió letöltést ért el, és a Google aktívan támogatja az ökoszisztémát a fejlesztők számára, beleértve a Hugging Face Transformers, llama.cpp, Ollama és más eszközöket. A Google elindította a Gemma 3n Impact Challenge-t is, amely 150.000 dolláros díjat kínál a platformon épített valós alkalmazásokért, tovább ösztönözve a fejlesztői közösséget.

Források:

1.

Introducing Gemma 3n: The developer guide- Google Developers Blog
Learn how to build with Gemma 3n, a mobile-first architecture, MatFormer technology, Per-Layer Embeddings, and new audio and vision encoders.

2.

Google Launches Lightweight Gemma 3n, Expanding Edge AI Efforts -- Campus Technology
Google DeepMind has officially launched Gemma 3n, the latest version of its lightweight generative AI model designed specifically for mobile and edge devices — a move that reinforces the company’s emphasis on on-device computing.

3.

Gemma 3n Introduces Novel Techniques for Enhanced Mobile AI Inference
Launched in early preview last May, Gemma 3n is now officially available. It targets mobile-first, on-device AI applications, using new techniques designed to increase efficiency and improve performance, such as per-layer embeddings and transformer nesting.