OpenAI a anunțat lansarea GPT-5.4, un nou model de inteligență artificială disponibil în ChatGPT, API și Codex, conceput pentru sarcini profesionale complexe, de la analiză de date și programare până la documente, prezentări și modele financiare, se arată într-un comunicat al companiei.
Compania spune că GPT-5.4 este cel mai performant și eficient model al său pentru muncă profesională, fiind lansată și o versiune GPT-5.4 Pro, destinată utilizatorilor care au nevoie de performanță maximă pentru sarcini complexe.
GPT-5.4 combină raționamentul, programarea și automatizarea
Noul model reunește progresele recente ale OpenAI în raționament, programare și fluxuri de lucru automatizate („agentic workflows”).
GPT-5.4 integrează capacitățile avansate de programare ale modelului GPT-5.3-Codex și îmbunătățește modul în care AI-ul lucrează cu instrumente software, aplicații și sarcini profesionale precum foi de calcul, prezentări și documente.
Potrivit companiei, modelul poate rezolva sarcini complexe din lumea reală mai precis și cu mai puține interacțiuni suplimentare între utilizator și AI.
În ChatGPT, varianta GPT-5.4 Thinking poate prezenta încă de la început un plan al procesului de gândire, astfel încât utilizatorii să poată ajusta direcția răspunsului în timp ce modelul lucrează.
De asemenea, modelul îmbunătățește cercetarea pe internet pentru întrebări foarte specifice, menținând mai bine contextul în sarcinile care necesită analiză mai complexă.
AI care poate folosi direct computerul
În Codex și în API, GPT-5.4 introduce capabilități native de utilizare a computerului, ceea ce permite agenților AI să opereze aplicații și sisteme software pentru a finaliza fluxuri de lucru complexe.
Modelul suportă până la 1 milion de tokeni de context, ceea ce permite planificarea și verificarea sarcinilor pe perioade lungi.
De asemenea, GPT-5.4 include un sistem de căutare a instrumentelor („tool search”), care ajută agenții să găsească și să utilizeze automat instrumentele potrivite într-un ecosistem mare de aplicații și conectori.
OpenAI mai spune că noul model este cel mai eficient din punct de vedere al consumului de tokeni, folosind mult mai puține resurse decât GPT-5.2 pentru rezolvarea problemelor.
Performanțe mai bune pentru activități profesionale
Pe benchmark-ul GDPval, care testează capacitatea AI de a produce muncă intelectuală în 44 de profesii, GPT-5.4 a egalat sau depășit performanța profesioniștilor în 83% dintre comparații, față de 70,9% pentru GPT-5.2.
Modelul a fost îmbunătățit în special pentru crearea și editarea de foi de calcul, prezentări și documente.
Pe un test intern de modelare în spreadsheet, similar sarcinilor realizate de un analist junior din investment banking, GPT-5.4 a obținut un scor de 87,3%, comparativ cu 68,4% pentru GPT-5.2.
În evaluări realizate de oameni, prezentările generate de GPT-5.4 au fost preferate în 68% dintre cazuri, datorită designului vizual mai bun și utilizării mai eficiente a imaginilor.
Mai puține „halucinații” și erori
OpenAI spune că GPT-5.4 este cel mai factual model al companiei până acum.
În teste realizate pe solicitări în care utilizatorii au semnalat erori factuale, afirmațiile individuale generate de GPT-5.4 au fost cu 33% mai puțin probabil să fie false, iar răspunsurile complete cu 18% mai puțin probabil să conțină erori, comparativ cu GPT-5.2.
Rezultate mai bune în utilizarea computerului și înțelegerea imaginilor
Pe benchmark-ul OSWorld-Verified, care măsoară capacitatea AI de a naviga într-un mediu desktop folosind capturi de ecran și comenzi de mouse și tastatură, GPT-5.4 a obținut o rată de succes de 75%, depășind atât GPT-5.2 (47,3%), cât și performanța umană (72,4%).
Pe WebArena-Verified, un test pentru utilizarea browserului, modelul a obținut 67,3% rată de succes.
De asemenea, GPT-5.4 a demonstrat o înțelegere vizuală mai bună, cu rezultate îmbunătățite în benchmark-ul MMMU-Pro și o analiză mai precisă a documentelor în OmniDocBench.