EN

A Tencent új modellt mutatott be: 44%-kal gyorsabb válaszidő, kétszeres szógenerálási sebesség

A Tencent új modellt mutatott be: 44%-kal gyorsabb válaszidő, kétszeres szógenerálási sebesség
Kép: Flickr - heilau

A kínai technológiai óriás Tencent 2025. február 27-én bemutatta legújabb "gyors gondolkodású" mesterséges intelligencia modelljét, a Hunyuan Turbo S-t, amely 44%-kal csökkentett válaszidővel és kétszeres szógenerálási sebességgel rendelkezik a DeepSeek R1 modelljéhez képest. Az új modell innovatív Hybrid-Mamba-Transformer architektúrát alkalmaz, amely jelentősen csökkenti a számítási komplexitást és képes hatékonyan kezelni mind az intuitív gyors válaszokat, mind a komplex problémák megoldását igénylő feladatokat.

A Hunyuan Turbo S teljesítménye a független teszteken a vezető ipari modellek, mint a DeepSeek V3, GPT-4o és Claude szintjét éri el tudás, matematika és kreatív tartalom generálás területén. A modell használata a fejlesztők számára költséghatékony: minden egymillió feldolgozott token után bemeneti adatnál 0,8 jüant (kb. 11 centet), kimeneti adatnál 2 jüant (kb. 27 centet) számít fel a vállalat. A Tencent közleménye szerint a Hunyuan Turbo S lesz a jövőben a vállalat AI modellcsaládjának alapja, amelyre különböző speciális célú modelleket építenek majd a következtetés, hosszú szövegek kezelése és programkód generálás területén.

A kínai AI fejlesztések terén éles verseny bontakozott ki, kezdve a DeepSeek-V3 modell 2024 decemberi megjelenésével, amely a nyugati modellek teljesítményét nyújtotta töredék áron, majd az Alibaba frissített Qwen2.5-Max modelljével, amely a Meta Llama és DeepSeek-V3 modelleknél gyorsabbnak bizonyult. A Hunyuan Turbo S következő lépésként egyedi gyors és lassú gondolkodás megközelítést alkalmaz, amely ötvözi az azonnali válaszadási képességet (gyors gondolkodás) a mélyebb elemzési képességekkel (lassú gondolkodás), amely a MMLU, Chinese-SimpleQA és C-Eval teszteken kimagasló eredményeket ért el, miközben a matematikai teljesítménye (MATH és AIME2024) is kiemelkedő.

Forrás: https://github.com/Tencent/llm.hunyuan.turbo-s?tab=readme-ov-file&source=post_page-----d64a02bed5c8---------------------------------------
Forrás: https://github.com/Tencent/llm.hunyuan.turbo-s?tab=readme-ov-file&source=post_page-----d64a02bed5c8---------------------------------------

Források:

1.

Tencent Unveils Hunyuan Turbo S AI Model Amid Heating Competition
Chinese tech giant Tencent unveiled its new “fast thinking” Hunyuan Turbo S AI model Thursday and claimed that it is faster than DeepSeek’s R1 model, indicating that competition between AI companies continues to soar.

2.

GitHub - Tencent/llm.hunyuan.turbo-s
Contribute to Tencent/llm.hunyuan.turbo-s development by creating an account on GitHub.

3.

Tencent HunYuan Turbo S: The fastest reasoning LLM
At par with DeepSeek, Claude 3.5 and GPT-4o

4.

Tencent’s Turbo AI: A New Benchmark in Speed and Efficiency
Tencent’s Turbo AI: A New Benchmark in Speed and Efficiency