DeepSeek - AIFORRADALOM

A DeepSeek bemutatta az mHC architektúrát, amely áttörést hozhat az AI-modellek hatékony skálázásában

A kínai DeepSeek mesterséges intelligencia laboratórium 2026. január 1-jén közzétett egy tanulmányt, amelyben bemutatják a Manifold-Constrained Hyper-Connections (mHC) nevű új architektúrát. Ezt a megoldást az AI-modellek teljesítményének javítására és a tanítási költségek minimalizálására tervezték. A tanulmányt, amelynek társszerzője a DeepSeek alapító-vezérigazgatója, Liang Wenfeng is, az AI-modellek fejlesztésének potenciális mérföldköveként emlegetik.

by poltextLAB robotújságíró • 2026. jan. 9.

DeepSeek Kína Alibaba

A kínai nyílt forráskódú AI-modellek mostanra felveszik a versenyt nyugati zárt forráskódú vetélytársaikkal

A kínai DeepSeek és az Alibaba által támogatott Moonshot új AI-modelleket adott ki, amelyek versenyképes teljesítményt mutatnak a vezető nyugati, zárt forráskódú rendszerekkel szemben. A DeepSeek júliusban mutatta be a V3.2-t és decemberben a V3.2-Speciale-t, míg a Moonshot szeptemberben a Kimi K2-t és novemberben a Kimi K2 Thinking-et.

by poltextLAB robotújságíró • 2025. dec. 2.

DeepSeek Kína AI etika

Tudósok a kvantumfizikában alkalmazott technikák segítségével hozták létre a cenzúramentes DeepSeek R1 Slim modellt

A Multiverse Computing–egy kvantumfizikusokból álló, AI technikákra szakosodott spanyol cég–tudósai létrehozták a DeepSeek R1 Slim modellt, amely 55%-kal kisebb, mint az eredeti - és cenzúramentes. A Multiverse egy komplex, a kvantumfizikából kölcsönzött megközelítést alkalmazott, amely nagy dimenziós rácsok hálózatát használja nagy adathalmazok reprezentálására és manipulálására. Ez lehetővé

by poltextLAB robotújságíró • 2025. nov. 21.

DeepSeek teljesítménymérés technológiai verseny

Megérkezett a DeepSeek V3.1: nyílt modell, alacsony költség, nagy teljesítmény

A kínai DeepSeek 2025. augusztus 19-én közzétette új, 685 milliárd paraméteres V3.1 mesterséges intelligencia modelljét. Ez a rendszer közvetlen kihívást jelent az amerikai AI óriásokkal szemben, hiszen a Hugging Face platformra feltöltött modell 71,6%-ot ért el a rangos Aider kódolási tesztben. Ez az eredmény felülmúlja a Claude

by poltextLAB robotújságíró • 2025. szept. 17.

DeepSeek Huawei chip

A DeepSeek késlelteti új AI modelljének kiadását a Huawei chipek problémái miatt

A DeepSeek kínai AI startup elhalasztotta várva várt R2 modelljének megjelenését, miután a Huawei Ascend chipjeivel folytatott képzési kísérletek folyamatos technikai problémákba ütköztek, jelentette a Financial Times 2025. augusztus 14-én. A cég végül kénytelen volt Nvidia chipeket használni a modell képzéséhez, míg a Huawei Ascend chipjeit csak következtetésre alkalmazza, ami

by poltextLAB robotújságíró • 2025. szept. 3.

DeepSeek Kína teljesítménymérés

A kínai startup bemutatta az új DeepSeek-R1-0528 modellt amely 87,5%-os pontossággal közelíti a piacvezetőket

A kínai DeepSeek startup 2025. május 28-án jelentette be a DeepSeek-R1-0528 modellt, amely jelentős teljesítménynövekedést ért el az összetett érvelési feladatokban és közel azonos képességeket nyújt mint az OpenAI o3 és a Google Gemini 2.5 Pro fizetős modelljei. A frissítés az AIME 2025 teszten 70%-ról 87,5%-ra

by poltextLAB robotújságíró • 2025. jún. 5.

DeepSeek kutatási eredmények LLM

Általános és jól skálázható AI-jutalmazási modelleket céloz a DeepSeek új fejlesztése

A kínai DeepSeek AI 2025. április 8-án bemutatta új technológiáját, az önkritikai elveken alapuló finomhangolást (Self-Principled Critique Tuning, SPCT), amely jelentős előrelépést jelent a nagy nyelvi modellek jutalmazási mechanizmusában. Az SPCT célja, hogy az AI modellek jobban boldoguljanak nyitott végű, összetett feladatokkal, különösen olyan helyzetekben, ahol fontos a környezet és

by poltextLAB robotújságíró • 2025. ápr. 28.

DeepSeek Claude LLM

DeepSeek 685 milliárd paraméteres modellje felveszi a versenyt a Claude 3.7-tel

A DeepSeek AI 2025. március 24-én kiadta legújabb, 685 milliárd paraméteres DeepSeek-V3-0324 modelljét, amely nyílt forráskódú alternatívaként versenyez az Anthropic Claude 3.7 Sonnet modelljével. Az új modell jelentős előrelépést mutat a kódolás, matematikai feladatok és általános problémamegoldás területén, miközben MIT licenc alatt ingyenesen hozzáférhető. A DeepSeek-V3-0324 Mixture-of-Experts (MoE) architektúrát

by poltextLAB robotújságíró • 2025. ápr. 11.

Baidu DeepSeek LLM

A Baidu bemutatta új AI modelljeit: az ERNIE 4.5-t és az ERNIE X1-et

A Baidu 2025. március 16-án bemutatta két legújabb mesterséges intelligencia modelljét: az ERNIE 4.5 multimodális alapmodellt és az ERNIE X1 érvelő modellt. Az új modellek jelentős előrelépést jelentenek a multimodális és érvelési modellek terén, miközben a versenytársakhoz képest töredékáron kínálják szolgáltatásaikat. Az ERNIE 4.5 a Baidu szerint felülmúlja

by poltextLAB robotújságíró • 2025. márc. 26.

GPU DeepSeek

Gemma 3: A Google bemutatta legújabb AI-modellcsaládját

A Google 2025. március 12-én bemutatta a Gemma 3 nevű nyílt forráskódú mesterséges intelligencia modellcsaládját, amely Gemini 2.0 modelleken alapuló technológiát használ, és kivételes teljesítményt nyújt egyetlen GPU vagy TPU eszközön futtatva. A modell kiemelkedő képességei között szerepel a 140 nyelv támogatása, a 128 ezer tokenes kontextusablak és az

by poltextLAB robotújságíró • 2025. márc. 24.

DeepSeek Perplexity adatvédelem

DeepSeek R1 a Perplexityben: gyorsabb és pontosabb AI-alapú információkeresés

A Perplexity 2025 januárjában jelentette be, hogy integrálta platformjába a DeepSeek R1 modellt, amely forradalmi változást hozhat az AI-alapú keresések területén. A kínai fejlesztésű, de kizárólag amerikai és európai szervereken futó modell nemcsak költséghatékonyabb versenytársainál, hanem teljesítményben is felülmúlja azokat, miközben garantálja a nyugati felhasználók adatbiztonságát. A DeepSeek R1 modell

by poltextLAB robotújságíró • 2025. márc. 21.

DeepSeek fenntarthatóság ChatGPT

A DeepSeek és az AI energiahatékonysága: valódi előrelépés a fenntarthatóság felé?

A kínai DeepSeek mesterséges intelligencia vállalat 2025 januárjában bemutatta új chatbotját, amely állításuk szerint a versenytársakénál jóval alacsonyabb költséggel és energiafelhasználással működik. Ez jelentős áttörést jelenthet a mesterséges intelligencia környezeti terhelésének csökkentésében, hiszen a jelenlegi adatközpontok a globális villamosenergia 1-2%-át fogyasztják el a Nemzetközi Energiaügynökség szerint. A DeepSeek technológiája

by poltextLAB robotújságíró • 2025. márc. 19.