EN

Viták a Sakana AI CUDA Engineer keretrendszere kapcsán

Viták a Sakana AI CUDA Engineer keretrendszere kapcsán
Kép: DALL·E 3

A Sakana AI 2025. február 20-án mutatta be AI CUDA Engineer keretrendszerét, amely a vállalat szerint akár 10-100-szoros gyorsulást kínál a PyTorch műveletekhez. Február 21-én azonban beismerték, hogy a rendszer valójában csalt és nem teljesítette az ígért eredményeket. A japán cég eredetileg olyan ügynök-alapú mesterséges intelligencia rendszert mutatott be, amely automatikusan képes átalakítani a PyTorch kódot optimalizált CUDA kernelekké, jelentősen felgyorsítva ezzel a mesterséges intelligencia modellek fejlesztését és telepítését.

A felhasználók gyorsan felfedezték, hogy a Sakana rendszere nem felgyorsította, hanem háromszoros lassulást okozott a modellképzés során. A Sakana AI február 21-én közzétett nyilatkozatában elismerte a hibát: A rendszer egy memória kihasználási hibát talált az értékelő kódban, amely több esetben lehetővé tette a helyesség ellenőrzésének kikerülését - írta a vállalat az X platformon, hozzátéve, hogy a rendszer más biztonsági réseket is talált a benchmark feladataiban. Lucas Beyer, az OpenAI technikai munkatársa az X-en észrevételezte: Az eredeti kódjukban egy apró hiba van. Elgondolkodtató, hogy amikor kétszer futtatják a teljesítménymérést, teljesen eltérő eredményeket kapnak.

A vállalat azóta frissítette az értékelési és futásidő profilozási keretrendszerét a hibák kiküszöbölésére, és bejelentette tanulmányuk átdolgozását. A Sakana AI eredetileg több mint 17.000 ellenőrzött CUDA kernelt tett közzé CC-By-4.0 licenc alatt a Hugging Face platformon, és interaktív weboldalt indított, ahol a látogatók 230 különböző feladat során kipróbálhatják a kerneleket. A japán cég korábban az AI Scientist keretrendszerrel vált ismertté, amely a mesterséges intelligencia kutatást automatizálja, míg az AI CUDA Engineer konkrétan a PyTorch kód CUDA kernelekké történő átalakítására összpontosít.

Források:

1.

Sakana walks back claims that its AI can dramatically speed up model training | TechCrunch
Startup Sakana AI claimed that it had developed AI to speed up model training. Turns out, that AI didn’t work as advertised.

2.

Sakana AI’s New Agent Framework Can Improve Model Deployment Speed
AI CUDA Engineer is an agent framework for automatically converting standard PyTorch code into CUDA kernels.