Az Anthropic 2025. február 24-én bemutatta a Claude 3.7 Sonnet modellt, amely az első hibrid érvelési modell a piacon, és egy újszerű kiterjesztett gondolkodás képességgel rendelkezik. Ez az új funkció lehetővé teszi, hogy a modell több időt és számítási erőforrást fordítson összetett problémák megoldására, miközben a gondolkodási folyamat láthatóvá válik a felhasználók számára. A Claude 3.7 Sonnet minden Claude előfizetési csomagban elérhető, de a kiterjesztett gondolkodás mód csak a fizetős változatokban használható.
A Claude 3.7 Sonnet kiemelkedő teljesítményt nyújt a kódolási feladatokban, 62,3%-os pontosságot ért el a SWE-bench Verified tesztben (valós szoftvermérnöki problémák megoldását értékelő benchmark), szemben az OpenAI o3-mini modelljének 49,3%-os eredményével. Az Anthropic jelentősen, 45%-kal csökkentette a szükségtelen elutasítások számát (amikor a modell indokolatlanul tagadja meg a felhasználói kérések teljesítését), így a modell nagyobb valószínűséggel teljesíti a felhasználók kéréseit. A kiterjesztett gondolkodás elsősorban komplex feladatoknál bizonyult hasznosnak: az ideális gondolkodási mennyiség kontextusfüggő, a kreatív vagy filozófiai beszélgetéseknél az extenzívebb feltárás gyakran értékes. Az API felhasználók pontosan meghatározhatják, hány tokent használjon a modell gondolkodásra, egészen a 128 000 tokenes kimeneti határig.
Az Anthropic emellett bemutatta a Claude Code-ot is, egy parancssori AI-asszisztenst fejlesztők számára, amely jelenleg korlátozott kutatási előnézetben érhető el. A Claude 3.7 Sonnet már elérhető a Claude weboldalán, a Claude alkalmazásban, valamint az Anthropic API-n, az Amazon Bedrock és a Google Cloud Vertex AI platformokon keresztül.
Források:
1.

2.
3.
