A kínai technológiai óriás Tencent 2025. február 27-én bemutatta legújabb "gyors gondolkodású" mesterséges intelligencia modelljét, a Hunyuan Turbo S-t, amely 44%-kal csökkentett válaszidővel és kétszeres szógenerálási sebességgel rendelkezik a DeepSeek R1 modelljéhez képest. Az új modell innovatív Hybrid-Mamba-Transformer architektúrát alkalmaz, amely jelentősen csökkenti a számítási komplexitást és képes hatékonyan kezelni mind az intuitív gyors válaszokat, mind a komplex problémák megoldását igénylő feladatokat.
A Hunyuan Turbo S teljesítménye a független teszteken a vezető ipari modellek, mint a DeepSeek V3, GPT-4o és Claude szintjét éri el tudás, matematika és kreatív tartalom generálás területén. A modell használata a fejlesztők számára költséghatékony: minden egymillió feldolgozott token után bemeneti adatnál 0,8 jüant (kb. 11 centet), kimeneti adatnál 2 jüant (kb. 27 centet) számít fel a vállalat. A Tencent közleménye szerint a Hunyuan Turbo S lesz a jövőben a vállalat AI modellcsaládjának alapja, amelyre különböző speciális célú modelleket építenek majd a következtetés, hosszú szövegek kezelése és programkód generálás területén.
A kínai AI fejlesztések terén éles verseny bontakozott ki, kezdve a DeepSeek-V3 modell 2024 decemberi megjelenésével, amely a nyugati modellek teljesítményét nyújtotta töredék áron, majd az Alibaba frissített Qwen2.5-Max modelljével, amely a Meta Llama és DeepSeek-V3 modelleknél gyorsabbnak bizonyult. A Hunyuan Turbo S következő lépésként egyedi gyors és lassú gondolkodás megközelítést alkalmaz, amely ötvözi az azonnali válaszadási képességet (gyors gondolkodás) a mélyebb elemzési képességekkel (lassú gondolkodás), amely a MMLU, Chinese-SimpleQA és C-Eval teszteken kimagasló eredményeket ért el, miközben a matematikai teljesítménye (MATH és AIME2024) is kiemelkedő.


Források:
1.

2.
3.
4.
