Az OpenAI bevezette a GDPval mérőszámot: AI-modellek teljesítményének mérése 44 foglalkozás valós feladatain keresztül
Az OpenAI bemutatta a GDPval-t, amely 44 foglalkozás gazdaságilag értékes, valós feladatain méri az AI-modellek teljesítményét kilenc, az amerikai GDP-hez 5% felett hozzájáruló ágazatban. A cél a szintetikus tesztek helyett autentikus munkatermékeken (pl. jogi beadvány, műszaki terv, ápolási terv) alapuló mérés. A GDPval-v0 1 320 feladatot tartalmaz (ebből 220 nyílt