EN

Az Anthropic új Claude Opus 4.6 modellje iparágvezető teljesítményt nyújt a vállalati AI-piacon

Az Anthropic új Claude Opus 4.6 modellje iparágvezető teljesítményt nyújt a vállalati AI-piacon
Unsplash - Wonderlane

Az Anthropic 2026. február 5-én jelentette be legújabb AI-modelljét, a Claude Opus 4.6-ot, amely jelentős előrelépést hoz a kódolás, a hosszabb autonóm feladatvégzés és a professzionális munkaeszközök terén. Scott White, az Anthropic vállalati termékekért felelős vezetője szerint az iparág az ún. "vibe working" korszakába lép, ahol az AI egyre önállóbban végez összetett szakmai feladatokat.

A Claude Opus 4.6 az első olyan Opus modell, amely béta verzióban 1 millió tokenes kontextusablakkal rendelkezik, és akár 128 000 tokenes kimenetet is képes generálni. A GDPval-AA benchmarkon – amely pénzügyi, jogi és egyéb területeken méri a gazdaságilag értékes tudásmunkát – a modell mintegy 144 Elo ponttal múlja felül az OpenAI GPT-5.2-t, ami az esetek körülbelül 70%-ában magasabb pontszámot jelent. A modell a hosszabb kontextusablakban való információ-visszakeresésben is jelentős javulást mutat: az MRCR v2 teszten 76%-ot ért el, míg a Sonnet 4.5 csupán 18,5%-ot. Az Anthropic a Claude Code-ban bemutatta az "agent teams" funkciót is, amellyel több AI-ágens párhuzamosan dolgozhat egy projekten.

A modell a Terminal-Bench 2.0 és a Humanity's Last Exam teszteken is iparágvezető teljesítményt nyújt, és az automatizált biztonsági vizsgálat szerint a félrevezető viselkedések aránya alacsony maradt, miközben a túlzott visszautasítások terén a legalacsonyabb arányt mutatja a közelmúlt Claude modelljei között. A Claude Code éves szinten 1 milliárd dolláros bevételt ért el mindössze hat hónappal az általános elérhetővé tétele után, az Anthropic vállalati piaci részesedése pedig az Andreessen Horowitz felmérése szerint 2024 elejéről a közel nulláról 2026 januárjára mintegy 40%-ra emelkedett.

Források:

1.

Anthropic launches Claude Opus 4.6 as AI moves toward a ‘vibe working’ era
Anthropic’s latest AI model is better at coding, sustaining tasks for longer and creating high-quality professional work.

2.

Claude Opus 4.6
We’re upgrading our smartest model. Across agentic coding, computer use, tool use, search, and finance, Opus 4.6 is an industry-leading model, often by wide margin.

3.

Claude Opus 4.6