EN
DeepSeek

DeepSeek

DeepSeek 685 milliárd paraméteres modellje felveszi a versenyt a Claude 3.7-tel

A DeepSeek AI 2025. március 24-én kiadta legújabb, 685 milliárd paraméteres DeepSeek-V3-0324 modelljét, amely nyílt forráskódú alternatívaként versenyez az Anthropic Claude 3.7 Sonnet modelljével. Az új modell jelentős előrelépést mutat a kódolás, matematikai feladatok és általános problémamegoldás területén, miközben MIT licenc alatt ingyenesen hozzáférhető. A DeepSeek-V3-0324 Mixture-of-Experts (MoE) architektúrát

by poltextLAB robotújságíró

A Baidu bemutatta új AI modelljeit: az ERNIE 4.5-t és az ERNIE X1-et

A Baidu 2025. március 16-án bemutatta két legújabb mesterséges intelligencia modelljét: az ERNIE 4.5 multimodális alapmodellt és az ERNIE X1 érvelő modellt. Az új modellek jelentős előrelépést jelentenek a multimodális és érvelési modellek terén, miközben a versenytársakhoz képest töredékáron kínálják szolgáltatásaikat. Az ERNIE 4.5 a Baidu szerint felülmúlja

by poltextLAB robotújságíró

Gemma 3: A Google bemutatta legújabb AI-modellcsaládját

A Google 2025. március 12-én bemutatta a Gemma 3 nevű nyílt forráskódú mesterséges intelligencia modellcsaládját, amely Gemini 2.0 modelleken alapuló technológiát használ, és kivételes teljesítményt nyújt egyetlen GPU vagy TPU eszközön futtatva. A modell kiemelkedő képességei között szerepel a 140 nyelv támogatása, a 128 ezer tokenes kontextusablak és az

by poltextLAB robotújságíró

DeepSeek R1 a Perplexityben: gyorsabb és pontosabb AI-alapú információkeresés

A Perplexity 2025 januárjában jelentette be, hogy integrálta platformjába a DeepSeek R1 modellt, amely forradalmi változást hozhat az AI-alapú keresések területén. A kínai fejlesztésű, de kizárólag amerikai és európai szervereken futó modell nemcsak költséghatékonyabb versenytársainál, hanem teljesítményben is felülmúlja azokat, miközben garantálja a nyugati felhasználók adatbiztonságát. A DeepSeek R1 modell

by poltextLAB robotújságíró

A DeepSeek és az AI energiahatékonysága: valódi előrelépés a fenntarthatóság felé?

A kínai DeepSeek mesterséges intelligencia vállalat 2025 januárjában bemutatta új chatbotját, amely állításuk szerint a versenytársakénál jóval alacsonyabb költséggel és energiafelhasználással működik. Ez jelentős áttörést jelenthet a mesterséges intelligencia környezeti terhelésének csökkentésében, hiszen a jelenlegi adatközpontok a globális villamosenergia 1-2%-át fogyasztják el a Nemzetközi Energiaügynökség szerint. A DeepSeek technológiája

by poltextLAB robotújságíró

A Google válasza a piaci kihívásokra: Gemini 2.0 Flash Thinking

A Google 2025. február 5-én jelentette be a Gemini 2.0 Flash Thinking Experimental modelljét, amely ingyenesen elérhető a Gemini alkalmazásban. Ez a fejlesztés jelentős előrelépést jelent a mesterséges intelligencia területén, mivel a modell képes lépésről lépésre lebontani a problémákat, erősítve ezzel érvelési képességeit és komplex feladatok megoldására való alkalmasságát.

by poltextLAB robotújságíró

A DeepSeek gyors előretörése újraindította a vitát az indiai alapmodell-fejlesztésről

Sam Altman, az OpenAI vezérigazgatója 2025. február 5-én találkozott Ashwini Vaishnaw indiai informatikai miniszterrel, hogy megvitassák az ország mesterséges intelligencia fejlesztésére vonatkozó terveit. Altman korábban szkeptikus volt az indiai AI-alapmodellek létrehozásával kapcsolatban, különösen a költséghatékonyságot illetően, de mostani nyilatkozataiban már India vezető szerepét emelte ki a globális AI-forradalomban. Az OpenAI

by poltextLAB robotújságíró

Trump és az Nvidia vezérigazgatójának találkozója új exportkontroll szabályokat hozhat Kínával szemben

Donald Trump amerikai elnök és Jensen Huang, az Nvidia vezérigazgatója 2025. január 31-én kulcsfontosságú találkozót tartott a Fehér Házban a kínai DeepSeek térnyerése és a csúcstechnológiás chipek exportszabályozásának szigorítása ügyében. A megbeszélés különös aktualitását adja, hogy az amerikai Kereskedelmi Minisztérium jelenleg is vizsgálja, vajon a DeepSeek használ-e olyan amerikai chipeket,

Fordulat az OpenAI-nál: Sam Altman elismerte a zárt forráskódú stratégia hibáit

Az OpenAI vezérigazgatója, Sam Altman 2025. január 31-én egy Reddit fórumon elismerte, hogy cége a történelem rossz oldalán állt a nyílt forráskódú mesterséges intelligencia kérdésében, miután a kínai DeepSeek AI cég R1 modellje megrengette a globális piacokat. A bejelentés különösen jelentős, mivel az OpenAI az utóbbi években egyre inkább a

A Jevons-paradoxon megcáfolhatja a DeepSeek után kialakult AI-piaci pánikot

A DeepSeek kínai AI-vállalat január 20-i bejelentése, miszerint az OpenAI-hoz hasonló teljesítményű chatbotot képes működtetni jóval alacsonyabb erőforrás-felhasználással, 17%-os zuhanást okozott az NVIDIA részvényárfolyamában január 27-én. A technológiai szektor vezetői, köztük Satya Nadella, a Microsoft vezérigazgatója, a Jevons-paradoxonra hivatkozva érvelnek amellett, hogy az alacsonyabb költségek valójában növelik majd az

Az Alibaba új AI modellje felülmúlja a vezető versenytársakat

Az Alibaba bemutatta legújabb mesterséges intelligencia modelljét, a Qwen 2.5-Max-ot, amely a vállalat közlése szerint felülmúlja a jelenlegi piacvezető modelleket, köztük a DeepSeek-V3-at, az OpenAI GPT-4-et és a Meta Llama-3-at. A Mixture-of-Experts (MoE) architektúrára épülő modellt több mint 20 billió tokenen tanították, majd felügyelt finomhangolással (SFT) és emberi visszajelzéseken

by poltextLAB robotújságíró

Olcsó kínai AI kényszeríti stratégiaváltásra a Mistralt

A kínai DeepSeek AI startup januárban piacra dobta R1 nyelvi modelljét, amely az OpenAI modelljeihez hasonló teljesítményt nyújt, mindössze 6 millió dolláros fejlesztési költséggel - ez jelentős kihívás elé állítja az európai Mistral AI-t, amely eddig több mint 1 milliárd eurós befektetést gyűjtött és 5,8 milliárd eurós értékelést ért

by poltextLAB robotújságíró