Utilizatorii vor putea genera sau modifica imagini mai corect cu modelul multimodal GPT-4o în produsele companiei OpenAI, potrivit TechCrunch.
Firma de inteligență artificială va înlocui modelul DALL-E 3 cu GPT-4o pentru generarea de imagini, model care putea până acum să genereze sau să editeze numai text.
Actualizarea este disponibilă pentru utilizatorii abonați la ChatGPT Pro, abonamentul de 200 dolari/lună, în chatbot și în produsul de generare video Sora. În curând, aceasta va fi făcută disponibilă și pentru abonații la Plus, utilizatorii platformei în mod gratuit și pentru dezvoltatori prin interfața de programare (API).
GPT-4o cu output de imagine „gândește” puțin mai mult decât modelul de generare a imaginilor pe care îl înlocuiește efectiv pentru a face ceea ce OpenAI descrie ca imagini mai precise și mai detaliate.
Compania a spus pentru WSJ că a antrenat GPT-4o pe „date disponibile public”, precum și pe date proprietare din parteneriatele sale cu alte companii ca Shutterstock.
„Respectăm drepturile artiștilor în ceea ce privește modul în care realizăm producția și avem politici în vigoare care ne împiedică să generăm imagini care imită direct munca oricărui artist în viață”, a declarat Brad Lightcap, directorul de operațiuni al OpenAI.
OpenAI oferă un formular care permite creatorilor să solicite ca lucrările lor să fie eliminate din seturile sale de date de antrenament. Compania spune, de asemenea, că respectă cererile de a interzice roboților săi de web-scraping să colecteze date de antrenament, inclusiv imagini, de pe site-uri web.