EN

A kínai startup bemutatta az új DeepSeek-R1-0528 modellt amely 87,5%-os pontossággal közelíti a piacvezetőket

A kínai startup bemutatta az új DeepSeek-R1-0528 modellt amely 87,5%-os pontossággal közelíti a piacvezetőket
Forrás: Unsplash - Ben Iwara

A kínai DeepSeek startup 2025. május 28-án jelentette be a DeepSeek-R1-0528 modellt, amely jelentős teljesítménynövekedést ért el az összetett érvelési feladatokban és közel azonos képességeket nyújt mint az OpenAI o3 és a Google Gemini 2.5 Pro fizetős modelljei. A frissítés az AIME 2025 teszten 70%-ról 87,5%-ra növelte a pontosságot, míg a LiveCodeBench teszten 63,5%-ról 73,3%-ra javította a kódolási teljesítményt. A modell MIT licenc alatt érhető el kereskedelmi felhasználásra, és a DeepSeek API-n keresztül automatikusan frissül minden meglévő felhasználó számára további költségek nélkül.

A DeepSeek-R1-0528 jelentős algoritmikus optimalizáció eredményeként érte el ezeket a javulásokat, átlagosan 23 000 tokennel dolgozva kérdésenként, szemben az előző verzió 12 000 tokenjével. A "Humanity's Last Exam" teszten a teljesítmény több mint megduplázódott, 8,5%-ról 17,7%-ra emelkedett, míg új funkciókat is bevezetett, mint a JSON kimenet és funkcióhívás támogatása. A modell kisebb változata, a DeepSeek-R1-0528-Qwen3-8B, egyetlen GPU-n futtatható és állítólag felülmúlja a hasonló méretű modelleket bizonyos benchmarkokban, miközben a teljes méretű új R1 körülbelül tucatnyi 80GB-os GPU-t igényel.

A DeepSeek-R1-0528 megjelenése alátámasztja a vállalat elkötelezettségét a magas teljesítményű, nyílt forráskódú AI modellek fejlesztése iránt, amelyek versenyben állnak a vezető kereskedelmi megoldásokkal. A modell API költsége jelenleg 0,14 dollár millió bemeneti tokenért normál órákban és 2,19 dollár millió kimeneti tokenért, ami jelentősen kedvezőbb árfekvést jelent a fizetős alternatívákhoz képest. A fejlesztők és kutatók számára elérhető teljes dokumentációval és GitHub támogatással a DeepSeek-R1-0528 komoly kihívást jelent az AI piac meghatározó szereplői számára.

Források:

1.

DeepSeek-R1-0528 Release | DeepSeek API Docs
🚀 DeepSeek-R1-0528 is here!

2.

DeepSeek’s distilled new R1 AI model can run on a single GPU | TechCrunch
DeepSeek’s distilled new R1 AI model can run on a single GPU, putting it within reach of hobbyists.

3.

DeepSeek R1-0528 arrives in powerful open source challenge to OpenAI o3 and Google Gemini 2.5 Pro
Additionally, the model’s hallucination rate has been reduced, contributing to more reliable and consistent output.