Alibaba a lansat Qwen3, o familie de modele de inteligență artificială care este la nivelul celor mai bune modele Google și OpenAI și, în unele cazuri, chiar le depășește, potrivit spuselor companiei.
Majoritatea modelelor sunt, sau vor fi în curând, disponibile pentru descărcare sub o licență „open” de pe platformele Hugging Face și GitHub, conform TechCrunch.
Dimensiunea lor variază de la 0,6 miliarde parametri la 235 miliarde parametri.
Modelele Qwen3 sunt modele „hibride” în sensul în care acestea pot „gândi” probleme complexe pentru o perioadă mai lungă de timp sau pot răspunde rapid la solicitări mai simple. Raționamentul permite modelelor să se verifice în mod eficient, similar cu o3 de la OpenAI, dar cu prețul unei latențe mai mari.
Acestea suportă 119 limbi și dialecte, printre care și limba română, iar modelele au fost antrenate pe un set de date de aproape 36 trilioane de token-uri. Token-urile sunt biții bruți de date pe care un model le procesează; 1 milion de tokens echivalează cu aproximativ 750.000 de cuvinte.
Alibaba susține că modelele Qwen3 „excelează” în capabilitățile de folosire a instrumentelor, precum și în respectarea instrucțiunilor și copierea anumitor formate de date.