Az OpenAI 2025. április 16-án hivatalosan bejelentette az o3 és o4-mini modelleket, amelyek az érvelő modellek új generációját képviselik, és most először képesek önállóan használni a ChatGPT minden eszközét – beleértve a webes keresést, Python kódfuttatást, vizuális elemzést és képgenerálást.
Az o3 modell új rekordot állított fel a SWE-bench teszten 69,1%-os eredménnyel, miközben az o4-mini közel azonos, 68,1%-os teljesítményt nyújt kedvezőbb áron. A modellek képesek "képekkel gondolkodni", elemezni a feltöltött táblavázlatokat vagy diagramokat, és műveletek végrehajtására a képeken az érvelési folyamat során. Az o3 és o4-mini egyaránt felülmúlja elődjeit komplex kódolási, matematikai és tudományos feladatokban. A szakértői értékelések szerint az o3 20%-kal kevesebb súlyos hibát vét nehéz, valós feladatokban, mint az o1, különösen a programozás, üzleti tanácsadás és kreatív ötletelés területén.
A modellek árazása is versenyképes: az o3 egymillió bemeneti tokenért 10 dollárba kerül, míg az o4-mini mindössze 1,10 dollárba, ami megegyezik az o3-mini árával. A vállalat emellett bemutatta a Codex CLI-t, egy nyílt forráskódú kódolási eszközt, amely maximalizálja az érvelő modellek képességeit a terminálban. Az OpenAI a következő hetekben tervezi kiadni az o3-pro modellt is, amely kizárólag a ChatGPT Pro előfizetők számára lesz elérhető, miközben a vállalat fokozatosan egyesíti a GPT és az érvelő modellek képességeit a jövőbeni fejlesztésekben.
Források:
1.
Explore OpenAI's latest and most capable models, o3 and o4-mini, designed to think longer before responding and to utilize all tools within ChatGPT, including web browsing, Python execution, and visual reasoning.
2.
3.