EN
LLM

LLM

OpenAI új célpontja: manipulált hívások elleni AI-védelem

Az OpenAI 2025. április elején bejelentette, hogy részt vesz a New York-i székhelyű Adaptive Security 43 millió dolláros Series A finanszírozási körében, ami a vállalat első befektetése a kiberbiztonsági szektorban. A finanszírozást az Andreessen Horowitz (a16z) és az OpenAI Startup Fund közösen vezette, és célja a mesterséges intelligencia által támogatott

by poltextLAB robotújságíró

A Google bemutatta a gyógyszerfejlesztés felgyorsítását segítő TxGemma modellcsaládot

A Google 2025. március 25-én hivatalosan bejelentette a TxGemma modellek kiadását, amelyek a gyógyszerfejlesztés hatékonyságának növelésére szolgáló, nyílt forráskódú AI-modellek. A Gemma 2-n alapuló TxGemma három méretben (2B, 9B és 27B paraméter) érhető el, és kifejezetten arra tanították, hogy megértse és előrejelezze a terápiás vegyületek tulajdonságait a felfedezéstől a klinikai

by poltextLAB robotújságíró

Az Alibaba bemutatta a Qwen3 nyílt forráskódú AI modelljeit, amelyek túlszárnyalják az OpenAI o1-et

Az Alibaba 2025. április 28-án bemutatta a Qwen3 nevű, nyolc új AI modellből álló családot, amelyek közül a zászlóshajó 235 milliárd paraméteres Qwen3-235B-A22B modell teljesítménye több benchmarkon felülmúlja az OpenAI o1 és a DeepSeek R1 modelljeit, és megközelíti a Google Gemini 2.5 Pro-t. A modellek "hibrid gondolkodási"

by poltextLAB robotújságíró

Az Anthropic bevezette a havi 200 dolláros Claude előfizetést

Az Anthropic 2025. április 9-én bejelentette új, Max nevű prémium előfizetési csomagját Claude AI asszisztense számára, amely közvetlen versenytársa az OpenAI 200 dolláros ChatGPT Pro szolgáltatásának. A Max előfizetés két árkategóriában érhető el: havi 100 dollárért ötször, vagy havi 200 dollárért hússzor magasabb használati limitet kínál, mint a vállalat meglévő,

by poltextLAB robotújságíró

Az OpenAI PaperBench az AI-ügynökök tudományos cikkek újraalkotásában nyújtott teljesítményét méri

Az OpenAI 2025. április 2-án bemutatta a PaperBench-et, egy új teljesítménymérő rendszert, amely az AI ágensek képességeit értékeli a legújabb mesterséges intelligencia kutatások replikálásában. Ez az eszköz az OpenAI Preparedness Framework részeként jött létre, amely a mesterséges intelligencia rendszerek összetett feladatokra való felkészültségét méri. A PaperBench konkrétan arra kéri az

by poltextLAB robotújságíró

Nagy nyelvi modellek matematika olimpiákon: lenyűgöző eredmények vagy csupán blöff?

Az elmúlt időszakban jelentős előrelépés történt a nagy nyelvi modellek matematikai képességeinek terén, azonban a 2025-ös USAMO (USA Matematikai Olimpia) versenyén végzett részletes emberi értékelések szerint a jelenlegi modellek messze elmaradnak a valódi matematikai bizonyítások létrehozásában. Míg egyes benchmarkok, mint a MathArena, pozitív képet festenek az LLM-ek teljesítményéről az AIME

by poltextLAB robotújságíró

Alapmodellekre épülő AI-ügynökök: adatokkal igazolt vállalati hatékonyság 2025-ben

Az alapmodellekre épülő AI-ügynökök jelentős változást hoznak a vállalati környezetben 2025-ben, túllépve a hagyományos generatív AI megoldásokon. Míg a legtöbb szervezet még mindig csupán ChatGPT-szerű alkalmazásokat vezet be, az élenjáró vállalatok már olyan autonóm AI-ügynököket alkalmaznak, amelyek nemcsak reagálnak a parancsokra, hanem aktívan végrehajtanak összetett üzleti folyamatokat minimális emberi beavatkozással.

by poltextLAB robotújságíró

Az Amazon Nova Sonic modellje egyszerűsíti a valós idejű hangalapú interakciókat

Az Amazon 2025. április 8-án bejelentette a Nova Sonic alapmodellt, amely egyesíti a beszédértést és a beszédgenerálást egyetlen modellben, lehetővé téve az emberibb hangalapú beszélgetéseket a mesterséges intelligencia alkalmazásokban. Ez az új technológia nemcsak azt érti meg, amit mondunk, hanem azt is, hogy hogyan mondjuk – beleértve a hanglejtést, a stílust

by poltextLAB robotújságíró

Általános és jól skálázható AI-jutalmazási modelleket céloz a DeepSeek új fejlesztése

A kínai DeepSeek AI 2025. április 8-án bemutatta új technológiáját, az önkritikai elveken alapuló finomhangolást (Self-Principled Critique Tuning, SPCT), amely jelentős előrelépést jelent a nagy nyelvi modellek jutalmazási mechanizmusában. Az SPCT célja, hogy az AI modellek jobban boldoguljanak nyitott végű, összetett feladatokkal, különösen olyan helyzetekben, ahol fontos a környezet és

by poltextLAB robotújságíró

A Meta bemutatta az új, nyílt forráskódú multimodális Llama 4 modelljeit

A Meta 2025. április 5-én jelentette be legfejlettebb nagyméretű nyelvi modelljét, a Llama 4-et, ami a vállalat szerint az új, multimodális AI-innováció korszakának kezdetét jelenti. Az új modellcsalád két fő változattal debütált: a Llama 4 Scout és a Llama 4 Maverick néven, amelyek képesek szövegek, képek, videók és hang feldolgozására

by poltextLAB robotújságíró

DeepSeek 685 milliárd paraméteres modellje felveszi a versenyt a Claude 3.7-tel

A DeepSeek AI 2025. március 24-én kiadta legújabb, 685 milliárd paraméteres DeepSeek-V3-0324 modelljét, amely nyílt forráskódú alternatívaként versenyez az Anthropic Claude 3.7 Sonnet modelljével. Az új modell jelentős előrelépést mutat a kódolás, matematikai feladatok és általános problémamegoldás területén, miközben MIT licenc alatt ingyenesen hozzáférhető. A DeepSeek-V3-0324 Mixture-of-Experts (MoE) architektúrát

by poltextLAB robotújságíró

A Google új modellcsaládott mutatott be: a Gemini 2.5 a vállalat eddigi legfejlettebb érvelő modellje

A Google 2025. március 25-én mutatta be a Gemini 2.5 mesterségesintelligencia-modellcsaládot, amely a vállalat eddigi legfejlettebb érvelő AI rendszere. Az első kiadott verzió, a Gemini 2.5 Pro Experimental, amely képes érvelni válaszadás előtt, jelentősen javítva ezzel a teljesítményt és pontosságot. A modell már elérhető a Google AI Studio

by poltextLAB robotújságíró