LLM - AIFORRADALOM (Page 2)

Az Amazon Nova Sonic modellje egyszerűsíti a valós idejű hangalapú interakciókat

Az Amazon 2025. április 8-án bejelentette a Nova Sonic alapmodellt, amely egyesíti a beszédértést és a beszédgenerálást egyetlen modellben, lehetővé téve az emberibb hangalapú beszélgetéseket a mesterséges intelligencia alkalmazásokban. Ez az új technológia nemcsak azt érti meg, amit mondunk, hanem azt is, hogy hogyan mondjuk – beleértve a hanglejtést, a stílust

by poltextLAB robotújságíró • 2025. ápr. 30.

DeepSeek kutatási eredmények LLM

Általános és jól skálázható AI-jutalmazási modelleket céloz a DeepSeek új fejlesztése

A kínai DeepSeek AI 2025. április 8-án bemutatta új technológiáját, az önkritikai elveken alapuló finomhangolást (Self-Principled Critique Tuning, SPCT), amely jelentős előrelépést jelent a nagy nyelvi modellek jutalmazási mechanizmusában. Az SPCT célja, hogy az AI modellek jobban boldoguljanak nyitott végű, összetett feladatokkal, különösen olyan helyzetekben, ahol fontos a környezet és

by poltextLAB robotújságíró • 2025. ápr. 28.

Meta Llama LLM

A Meta bemutatta az új, nyílt forráskódú multimodális Llama 4 modelljeit

A Meta 2025. április 5-én jelentette be legfejlettebb nagyméretű nyelvi modelljét, a Llama 4-et, ami a vállalat szerint az új, multimodális AI-innováció korszakának kezdetét jelenti. Az új modellcsalád két fő változattal debütált: a Llama 4 Scout és a Llama 4 Maverick néven, amelyek képesek szövegek, képek, videók és hang feldolgozására

by poltextLAB robotújságíró • 2025. ápr. 24.

DeepSeek Claude LLM

DeepSeek 685 milliárd paraméteres modellje felveszi a versenyt a Claude 3.7-tel

A DeepSeek AI 2025. március 24-én kiadta legújabb, 685 milliárd paraméteres DeepSeek-V3-0324 modelljét, amely nyílt forráskódú alternatívaként versenyez az Anthropic Claude 3.7 Sonnet modelljével. Az új modell jelentős előrelépést mutat a kódolás, matematikai feladatok és általános problémamegoldás területén, miközben MIT licenc alatt ingyenesen hozzáférhető. A DeepSeek-V3-0324 Mixture-of-Experts (MoE) architektúrát

by poltextLAB robotújságíró • 2025. ápr. 11.

Gemini LLM

A Google új modellcsaládott mutatott be: a Gemini 2.5 a vállalat eddigi legfejlettebb érvelő modellje

A Google 2025. március 25-én mutatta be a Gemini 2.5 mesterségesintelligencia-modellcsaládot, amely a vállalat eddigi legfejlettebb érvelő AI rendszere. Az első kiadott verzió, a Gemini 2.5 Pro Experimental, amely képes érvelni válaszadás előtt, jelentősen javítva ezzel a teljesítményt és pontosságot. A modell már elérhető a Google AI Studio

by poltextLAB robotújságíró • 2025. ápr. 8.

európai fejlesztések LLM

EuroBERT: Új fejlesztésű többnyelvű kódoló modellcsalád a nyelvtechnológiában

Az EuroBERT, az új többnyelvű kódoló modellcsalád jelentős előrelépést jelent a modern nyelvtechnológiában, amely 15 európai és globális nyelv hatékonyabb feldolgozását biztosítja 8.192 tokenig terjedő szekvenciákkal. 2025. március 10-én mutatták be hivatalosan az EuroBERT modellcsaládot, amelyet 5 billió tokennel képeztek ki, és három méretben (210M, 610M és 2,1B

by poltextLAB robotújságíró • 2025. ápr. 7.

Tencent LLM Kína

A Tencent új modellt mutatott be: 44%-kal gyorsabb válaszidő, kétszeres szógenerálási sebesség

A kínai technológiai óriás Tencent 2025. február 27-én bemutatta legújabb "gyors gondolkodású" mesterséges intelligencia modelljét, a Hunyuan Turbo S-t, amely 44%-kal csökkentett válaszidővel és kétszeres szógenerálási sebességgel rendelkezik a DeepSeek R1 modelljéhez képest. Az új modell innovatív Hybrid-Mamba-Transformer architektúrát alkalmaz, amely jelentősen csökkenti a számítási komplexitást és

by poltextLAB robotújságíró • 2025. ápr. 4.

Microsoft Hugging Face LLM

Microsoft Phi-4: kompakt modell multimodális képességekkel

A Microsoft 2025 februárjában mutatta be a Phi-4 modellcsalád két új tagját, amelyek közül a Phi-4-multimodal-instruct különösen figyelemreméltó, mivel mindössze 5,6 milliárd paraméterrel képes szöveg, kép és hang egyidejű feldolgozására, miközben teljesítménye egyes feladatokban versenyképes a kétszer nagyobb modellekkel is. A Phi-4-multimodal-instruct egy innovatív "Mixture of LoRAs"

by poltextLAB robotújságíró • 2025. márc. 31.

magyar fejlesztések kutatási eredmények LLM

Korpuszméret vs. minőség: új kutatás a magyar nyelvi modellek hatékonyságáról

A magyar nyelvtechnológiai kutatás jelentős mérföldkőhöz érkezett: egy átfogó vizsgálat kimutatta, hogy a nagyobb korpuszméret nem feltétlenül eredményez jobb teljesítményt a morfológiai elemzésben. Dömötör Andrea, Indig Balázs és Nemeskey Dávid Márk kutatásukban három különböző méretű magyar nyelvű korpuszt – az ELTE DH gold standard korpuszt (496 060 token), az NYTK-NerKort (1

by poltextLAB robotújságíró • 2025. márc. 28.

magyar fejlesztések kutatási eredmények LLM

A huBERT modell kontextusérzékenysége pragmatikai annotációban - új kutatási eredmények

A Szegedi Tudományegyetem kutatói, Szécsényi Tibor és Virág Nándor a huBERT nyelvi modell kontextusfüggőségét vizsgálták pragmatikai annotáció során, különös tekintettel a felszólító alakok funkcióinak automatikus azonosítására. A MedCollect egészségügyi álhírkorpuszon végzett kutatás azt elemzi, hogyan befolyásolja a rendelkezésre álló kontextus mérete és pozíciója a modell annotációs pontosságát. A vizsgálat során

by poltextLAB robotújságíró • 2025. márc. 27.

Baidu DeepSeek LLM

A Baidu bemutatta új AI modelljeit: az ERNIE 4.5-t és az ERNIE X1-et

A Baidu 2025. március 16-án bemutatta két legújabb mesterséges intelligencia modelljét: az ERNIE 4.5 multimodális alapmodellt és az ERNIE X1 érvelő modellt. Az új modellek jelentős előrelépést jelentenek a multimodális és érvelési modellek terén, miközben a versenytársakhoz képest töredékáron kínálják szolgáltatásaikat. Az ERNIE 4.5 a Baidu szerint felülmúlja

by poltextLAB robotújságíró • 2025. márc. 26.

LegalTech LLM

Az első jogi AI teljesítménymérés: a Harvey és a CoCounsel kiemelkedő eredményei

Az első átfogó jogi mesterséges intelligencia teljesítménymérési tanulmány, amelyet a Vals AI tett közzé 2025. február 27-én, jelentős különbségeket tárt fel a vezető jogi AI eszközök között, ahol a Harvey és a Thomson Reuters CoCounsel kiemelkedő eredményeket ért el hét kritikus jogi feladatkörben. A tanulmány négy AI eszközt – Harvey, CoCounsel,

by poltextLAB robotújságíró • 2025. márc. 19.