EN
LLM

LLM

A Meta bemutatta az új, nyílt forráskódú multimodális Llama 4 modelljeit

A Meta 2025. április 5-én jelentette be legfejlettebb nagyméretű nyelvi modelljét, a Llama 4-et, ami a vállalat szerint az új, multimodális AI-innováció korszakának kezdetét jelenti. Az új modellcsalád két fő változattal debütált: a Llama 4 Scout és a Llama 4 Maverick néven, amelyek képesek szövegek, képek, videók és hang feldolgozására

by poltextLAB robotújságíró

DeepSeek 685 milliárd paraméteres modellje felveszi a versenyt a Claude 3.7-tel

A DeepSeek AI 2025. március 24-én kiadta legújabb, 685 milliárd paraméteres DeepSeek-V3-0324 modelljét, amely nyílt forráskódú alternatívaként versenyez az Anthropic Claude 3.7 Sonnet modelljével. Az új modell jelentős előrelépést mutat a kódolás, matematikai feladatok és általános problémamegoldás területén, miközben MIT licenc alatt ingyenesen hozzáférhető. A DeepSeek-V3-0324 Mixture-of-Experts (MoE) architektúrát

by poltextLAB robotújságíró

A Google új modellcsaládott mutatott be: a Gemini 2.5 a vállalat eddigi legfejlettebb érvelő modellje

A Google 2025. március 25-én mutatta be a Gemini 2.5 mesterségesintelligencia-modellcsaládot, amely a vállalat eddigi legfejlettebb érvelő AI rendszere. Az első kiadott verzió, a Gemini 2.5 Pro Experimental, amely képes érvelni válaszadás előtt, jelentősen javítva ezzel a teljesítményt és pontosságot. A modell már elérhető a Google AI Studio

by poltextLAB robotújságíró

EuroBERT: Új fejlesztésű többnyelvű kódoló modellcsalád a nyelvtechnológiában

Az EuroBERT, az új többnyelvű kódoló modellcsalád jelentős előrelépést jelent a modern nyelvtechnológiában, amely 15 európai és globális nyelv hatékonyabb feldolgozását biztosítja 8.192 tokenig terjedő szekvenciákkal. 2025. március 10-én mutatták be hivatalosan az EuroBERT modellcsaládot, amelyet 5 billió tokennel képeztek ki, és három méretben (210M, 610M és 2,1B

by poltextLAB robotújságíró

A Tencent új modellt mutatott be: 44%-kal gyorsabb válaszidő, kétszeres szógenerálási sebesség

A kínai technológiai óriás Tencent 2025. február 27-én bemutatta legújabb "gyors gondolkodású" mesterséges intelligencia modelljét, a Hunyuan Turbo S-t, amely 44%-kal csökkentett válaszidővel és kétszeres szógenerálási sebességgel rendelkezik a DeepSeek R1 modelljéhez képest. Az új modell innovatív Hybrid-Mamba-Transformer architektúrát alkalmaz, amely jelentősen csökkenti a számítási komplexitást és

by poltextLAB robotújságíró

Microsoft Phi-4: kompakt modell multimodális képességekkel

A Microsoft 2025 februárjában mutatta be a Phi-4 modellcsalád két új tagját, amelyek közül a Phi-4-multimodal-instruct különösen figyelemreméltó, mivel mindössze 5,6 milliárd paraméterrel képes szöveg, kép és hang egyidejű feldolgozására, miközben teljesítménye egyes feladatokban versenyképes a kétszer nagyobb modellekkel is. A Phi-4-multimodal-instruct egy innovatív "Mixture of LoRAs"

by poltextLAB robotújságíró

Korpuszméret vs. minőség: új kutatás a magyar nyelvi modellek hatékonyságáról

A magyar nyelvtechnológiai kutatás jelentős mérföldkőhöz érkezett: egy átfogó vizsgálat kimutatta, hogy a nagyobb korpuszméret nem feltétlenül eredményez jobb teljesítményt a morfológiai elemzésben. Dömötör Andrea, Indig Balázs és Nemeskey Dávid Márk kutatásukban három különböző méretű magyar nyelvű korpuszt – az ELTE DH gold standard korpuszt (496 060 token), az NYTK-NerKort (1

by poltextLAB robotújságíró

A huBERT modell kontextusérzékenysége pragmatikai annotációban - új kutatási eredmények

A Szegedi Tudományegyetem kutatói, Szécsényi Tibor és Virág Nándor a huBERT nyelvi modell kontextusfüggőségét vizsgálták pragmatikai annotáció során, különös tekintettel a felszólító alakok funkcióinak automatikus azonosítására. A MedCollect egészségügyi álhírkorpuszon végzett kutatás azt elemzi, hogyan befolyásolja a rendelkezésre álló kontextus mérete és pozíciója a modell annotációs pontosságát. A vizsgálat során

by poltextLAB robotújságíró

A Baidu bemutatta új AI modelljeit: az ERNIE 4.5-t és az ERNIE X1-et

A Baidu 2025. március 16-án bemutatta két legújabb mesterséges intelligencia modelljét: az ERNIE 4.5 multimodális alapmodellt és az ERNIE X1 érvelő modellt. Az új modellek jelentős előrelépést jelentenek a multimodális és érvelési modellek terén, miközben a versenytársakhoz képest töredékáron kínálják szolgáltatásaikat. Az ERNIE 4.5 a Baidu szerint felülmúlja

by poltextLAB robotújságíró

Az első jogi AI teljesítménymérés: a Harvey és a CoCounsel kiemelkedő eredményei

Az első átfogó jogi mesterséges intelligencia teljesítménymérési tanulmány, amelyet a Vals AI tett közzé 2025. február 27-én, jelentős különbségeket tárt fel a vezető jogi AI eszközök között, ahol a Harvey és a Thomson Reuters CoCounsel kiemelkedő eredményeket ért el hét kritikus jogi feladatkörben. A tanulmány négy AI eszközt – Harvey, CoCounsel,

by poltextLAB robotújságíró

A Meta Llama modellje átalakítja a Sevilla FC játékosmegfigyelését

A Sevilla FC új AI-alapú eszközt vet be a tehetségkutatásban, amely radikálisan átalakítja a játékosmegfigyelés folyamatát. A klub az IBM-mel együttműködve kifejlesztette a Scout Advisort, egy generatív AI-alapú megfigyelőrendszert, amely a watsonx platformon és a Meta Llama 3.1 modellen fut. Az innováció célja a több mint 300 000 játékosmegfigyelési

by poltextLAB robotújságíró

Az OpenAI bemutatta új nyelvi modelljét, a GPT-4.5-öt

Az OpenAI 2025. február 27-én hivatalosan kiadta a GPT-4.5 elnevezésű nagy nyelvi modelljét, amely a vállalat eddigi legnagyobb és legszélesebb tudásbázissal rendelkező modellje. A GPT-4.5 jelentősen kevesebb hallucinációval működik (37,1% szemben a GPT-4o 61,8%-ával), és elsősorban a ChatGPT Pro előfizetők, valamint a fejlesztők számára érhető

by poltextLAB robotújságíró