OpenAI a lansat GPT-5.4, noul model AI pentru muncă profesională. Promite rezultate mai rapide și mai puține erori

OpenAI a anunțat lansarea GPT-5.4, un nou model de inteligență artificială disponibil în ChatGPT, API și Codex, conceput pentru sarcini profesionale complexe, de la analiză de date și programare până la documente, prezentări și modele financiare, se arată într-un comunicat al companiei.

Compania spune că GPT-5.4 este cel mai performant și eficient model al său pentru muncă profesională, fiind lansată și o versiune GPT-5.4 Pro, destinată utilizatorilor care au nevoie de performanță maximă pentru sarcini complexe.

GPT-5.4 combină raționamentul, programarea și automatizarea

Noul model reunește progresele recente ale OpenAI în raționament, programare și fluxuri de lucru automatizate („agentic workflows”).

GPT-5.4 integrează capacitățile avansate de programare ale modelului GPT-5.3-Codex și îmbunătățește modul în care AI-ul lucrează cu instrumente software, aplicații și sarcini profesionale precum foi de calcul, prezentări și documente.

Potrivit companiei, modelul poate rezolva sarcini complexe din lumea reală mai precis și cu mai puține interacțiuni suplimentare între utilizator și AI.

În ChatGPT, varianta GPT-5.4 Thinking poate prezenta încă de la început un plan al procesului de gândire, astfel încât utilizatorii să poată ajusta direcția răspunsului în timp ce modelul lucrează.

De asemenea, modelul îmbunătățește cercetarea pe internet pentru întrebări foarte specifice, menținând mai bine contextul în sarcinile care necesită analiză mai complexă.

AI care poate folosi direct computerul

În Codex și în API, GPT-5.4 introduce capabilități native de utilizare a computerului, ceea ce permite agenților AI să opereze aplicații și sisteme software pentru a finaliza fluxuri de lucru complexe.

Modelul suportă până la 1 milion de tokeni de context, ceea ce permite planificarea și verificarea sarcinilor pe perioade lungi.

De asemenea, GPT-5.4 include un sistem de căutare a instrumentelor („tool search”), care ajută agenții să găsească și să utilizeze automat instrumentele potrivite într-un ecosistem mare de aplicații și conectori.

OpenAI mai spune că noul model este cel mai eficient din punct de vedere al consumului de tokeni, folosind mult mai puține resurse decât GPT-5.2 pentru rezolvarea problemelor.

Performanțe mai bune pentru activități profesionale

Pe benchmark-ul GDPval, care testează capacitatea AI de a produce muncă intelectuală în 44 de profesii, GPT-5.4 a egalat sau depășit performanța profesioniștilor în 83% dintre comparații, față de 70,9% pentru GPT-5.2.

Modelul a fost îmbunătățit în special pentru crearea și editarea de foi de calcul, prezentări și documente.

Pe un test intern de modelare în spreadsheet, similar sarcinilor realizate de un analist junior din investment banking, GPT-5.4 a obținut un scor de 87,3%, comparativ cu 68,4% pentru GPT-5.2.

În evaluări realizate de oameni, prezentările generate de GPT-5.4 au fost preferate în 68% dintre cazuri, datorită designului vizual mai bun și utilizării mai eficiente a imaginilor.

Mai puține „halucinații” și erori

OpenAI spune că GPT-5.4 este cel mai factual model al companiei până acum.

În teste realizate pe solicitări în care utilizatorii au semnalat erori factuale, afirmațiile individuale generate de GPT-5.4 au fost cu 33% mai puțin probabil să fie false, iar răspunsurile complete cu 18% mai puțin probabil să conțină erori, comparativ cu GPT-5.2.

Rezultate mai bune în utilizarea computerului și înțelegerea imaginilor

Pe benchmark-ul OSWorld-Verified, care măsoară capacitatea AI de a naviga într-un mediu desktop folosind capturi de ecran și comenzi de mouse și tastatură, GPT-5.4 a obținut o rată de succes de 75%, depășind atât GPT-5.2 (47,3%), cât și performanța umană (72,4%).

Pe WebArena-Verified, un test pentru utilizarea browserului, modelul a obținut 67,3% rată de succes.

De asemenea, GPT-5.4 a demonstrat o înțelegere vizuală mai bună, cu rezultate îmbunătățite în benchmark-ul MMMU-Pro și o analiză mai precisă a documentelor în OmniDocBench.

Bitcoin revine peste 70.000 $ după tensiunile din Orientul Mijlociu. Ce spun analiștii despre piața crypto la începutul primăverii

Antreprenorii anului în România vin de la un startup AI dedicat creștinilor din toată lumea (EY)

Un startup de tehnologii pentru apărare, lansat de ucraineni, a ajuns „unicorn”, în urma unei investiții de 50 milioane dolari

Nouă finanțare de la investitori români și străini pentru startup-ul Fagura, care vrea să atragă până la 3 milioane EUR

Firmă IT românească: AI-ul a devenit parte integrantă din activitatea curentă a companiei, fiind utilizat atât în proiecte pentru clienți, cât și în procese interne și în deciziile de business

Apple lansează MacBook Neo, „cel mai accesibil” laptop din gamă

Apple dezvăluie noi laptopuri MacBook Air, acum cu procesor M5, și MacBook Pro, cu M5 Pro și M5 Max

Listă: Cele mai interesante lansări și concepte prezentate la evenimentul MWC 2026 din Barcelona

VIDEO „Numai în 2025, au fost lansate peste 1 milion de proiecte, dintre care numai 20% au avut parte de un audit de evaluare a securității. Nu există suficientă expertiză”. Doi hackeri antrenează agenți AI pentru a găsi vulnerabilități