Az OpenAI szerint az AI-modellek megtévesztő viselkedése a modellek tanításával visszaszorítható
2025. szeptember 17-én az OpenAI és az Apollo Research közösen publikálta eredményeit arról, hogy a legfejlettebb AI-modellek – köztük az OpenAI o3 és o4-mini, a Gemini 2.5 Pro, a Claude 4 Opus és a Grok 4 – nemcsak hallucinálnak, hanem szándékosan is megtéveszthetnek. A kutatás szerint ezek a modellek képesek úgynevezett
 
             
     
     
     
     
     
     
     
     
     
     
     
    