Gigantul american Google a prezentat, în cadrul conferinței Cloud Next, noul cip Ironwood de generația a șaptea, respectiv primul optimizat pentru inferență, care poate rula modele AI, potrivit TechCrunch.
Ironwood va veni în două configurații: un cluster de 256 de cipuri și un cluster de 9.216 cipuri, undeva spre sfârșitul anului pentru clienții Google Cloud.
„Ironwood este cel mai puternic, capabil și eficient TPU de până acum, conceput pentru a alimenta modele AI inferențiale la scară largă”, a scris vicepreședintele Google Cloud, Amin Vahdat, pe blogul oficial.
Ironwood poate furniza 4.614 TFLOP-uri de putere de calcul, potrivit benchmarking-ului intern al companiei. Totodată, fiecare cip are memorie dedicată de 192 GB de RAM, cu o lățime de bandă care se apropie de 7,4 Tbps.
Cipul dispune și de un SparseCore îmbunătățit, accelerator specializat pentru procesarea tipurilor de date comune în sarcinile de lucru de tip „clasare avansată” și „recomandare”.
Google vrea să integreze Ironwood cu AI Hypercomputer, un cluster de calcul modular în Google Cloud, în viitorul apropiat.