Az xAI 2025. szeptemberében jelentette be a Grok-4-Fast modellt, amely egységes architektúrába ötvözi az „érvelő" (reasoning) és „nem-érvelő" (non-reasoning) működési módokat, miközben 40%-kal kevesebb gondolkodási tokent használ, mint a Grok-4 modell. A Grok-4-Fast 2 millió szövegegységet tud egyszerre figyelembe venni, és úgy képezték ki, hogy külső eszközöket is hatékonyan használjon. Ennek köszönhetően képes az interneten böngészni, programkódot futtatni és más digitális segédeszközöket is működtetni.
Az xAI API-n keresztül két változatban érhető el: grok-4-fast-reasoning és grok-4-fast-non-reasoning, mindkét verzió 0,20 USD/1 millió bemeneti token (<128k) és 0,50 USD/1 millió kimeneti token (<128k) árazással, míg a gyorsítótárazott bemeneti tokenek 0,05 USD/1 millió áron érhetők el. A Grok-4-Fast kiemelkedő teljesítményt nyújt matematikai és tudományos érvelési feladatokban: 92,0%-ot ért el az AIME 2025 versenyen (középiskolai matematikai problémák), 93,3%-ot a HMMT 2025 teszten (harvard–MIT matematikai verseny), 85,7%-ot a GPQA Diamond értékelésen (doktori szintű tudományos kérdések) és 80,0%-ot a LiveCodeBench programozási teszten (január–május), miközben átlagosan 40%-kal kevesebb gondolkodási tokent használ, mint a Grok-4.
Az Artificial Analysis független felülvizsgálata szerint a Grok-4-Fast az élvonalbeli ár–intelligencia arány tekintetében a legjobb a nyilvánosan elérhető modellek között, és az xAI szerint 98%-kal alacsonyabb költségen éri el ugyanazt a teljesítményt, mint a Grok-4. Az xAI által közölt modellkártya szerint a Grok-4-Fast nagy léptékű megerősítéses tanulással lett betanítva az intelligencia sűrűségének maximalizálására, kifejezetten eszközhasználat és biztonsági demonstrációk alapján. Egységes modellarchitektúrája rendszerutasításokkal (system prompts) vezérelhető, ezáltal csökkenti a végpontok közötti késleltetést és tokenköltségeket, ami ideálissá teszi valós idejű alkalmazásokhoz, mint a keresés, interaktív kódolás.
Források:
1.
Grok 4 Fast delivers cost-efficient intelligence with a 2M token context window and unified reasoning architecture.
2.
Grok 4 Fast is a streamlined version of xAI’s flagship model
3.

