Az Anthropic újítása: a Claude 3.7 Sonnet és a kiterjesztett gondolkodás

Az Anthropic újítása: a Claude 3.7 Sonnet és a kiterjesztett gondolkodás
Kép: DALL·E 3

Az Anthropic 2025. február 24-én bemutatta a Claude 3.7 Sonnet modellt, amely az első hibrid érvelési modell a piacon, és egy újszerű kiterjesztett gondolkodás képességgel rendelkezik. Ez az új funkció lehetővé teszi, hogy a modell több időt és számítási erőforrást fordítson összetett problémák megoldására, miközben a gondolkodási folyamat láthatóvá válik a felhasználók számára. A Claude 3.7 Sonnet minden Claude előfizetési csomagban elérhető, de a kiterjesztett gondolkodás mód csak a fizetős változatokban használható.

A Claude 3.7 Sonnet kiemelkedő teljesítményt nyújt a kódolási feladatokban, 62,3%-os pontosságot ért el a SWE-bench Verified tesztben (valós szoftvermérnöki problémák megoldását értékelő benchmark), szemben az OpenAI o3-mini modelljének 49,3%-os eredményével. Az Anthropic jelentősen, 45%-kal csökkentette a szükségtelen elutasítások számát (amikor a modell indokolatlanul tagadja meg a felhasználói kérések teljesítését), így a modell nagyobb valószínűséggel teljesíti a felhasználók kéréseit. A kiterjesztett gondolkodás elsősorban komplex feladatoknál bizonyult hasznosnak: az ideális gondolkodási mennyiség kontextusfüggő, a kreatív vagy filozófiai beszélgetéseknél az extenzívebb feltárás gyakran értékes. Az API felhasználók pontosan meghatározhatják, hány tokent használjon a modell gondolkodásra, egészen a 128 000 tokenes kimeneti határig.

Az Anthropic emellett bemutatta a Claude Code-ot is, egy parancssori AI-asszisztenst fejlesztők számára, amely jelenleg korlátozott kutatási előnézetben érhető el. A Claude 3.7 Sonnet már elérhető a Claude weboldalán, a Claude alkalmazásban, valamint az Anthropic API-n, az Amazon Bedrock és a Google Cloud Vertex AI platformokon keresztül.

Források:

1.

Claude’s extended thinking
Discussing Claude’s new thought process

2.

I tested Anthropic’s Claude 3.7 Sonnet. Its ‘extended thinking’ mode outdoes ChatGPT and Grok, but it can overthink.
Anthropic has launched its Claude 3.7 Sonnet AI model, featuring an “extended thinking” mode. Here’s how it compares to ChatGPT and Grok.

3.

Claude 3.7 Sonnet debuts with “extended thinking” to tackle complex problems
Anthropic’s first simulated reasoning model is a beast at coding tasks.