Google lansează Gemini 3.5 Live Translate, un model de inteligență artificială audio care poate traduce audio aproape în timp real, în peste 70 de limbi, și care va fi lansat în aplicațiile Google Translate și Meet.
Modelul detectează automat peste 70 de limbi și generează voce tradusă, cu sunet natural, care păstrează intonația, ritmul și înălțimea vorbitorilor. Spre deosebire de sistemele „turn by turn” care așteaptă ca vorbitorul să termine de vorbit înainte de a răspunde, 3.5 Live Translate generează vorbire în mod continuu, scrie compania pe blogul oficial.
Noul Gemini 3.5 Live Translate va actualiza experiența de traducere vocală din aplicația Google Meet de la 5 limbi suportate la peste 70 de limbi și 2.000 de perechi lingvistice într-o singură întâlnire, alături de mai multă fluiditate.
În același timp, compania spune că va actualiza interfața Meet, astfel încât funcția să poată fi accesată mai ușor direct din platforma de videoconferințe.
Actualizarea va fi lansată pentru clienții selectați Workspace începând cu această lună, urmată de o lansare mai largă la sfârșitul acestui an.
Modelul va fi disponibil și în aplicația proprie de traduceri a companiei, Google Translate, pe Android și iOS. Astfel, Gemini 3.5 Live Translate va îmbunătăți experiența de Traducere live cu orice pereche de căști. În plus, pe telefoanele Android, se lansează un nou mod de ascultare, direct prin difuzorul de apeluri, utilizatorii având posibilitatea să asculte traducerile live întocmai ca și cum ar vorbi la telefon.
Tot sunetul generat de modelele Google este marcat cu SynthID. „Watermark-ul” imperceptibil este inclus direct în ieșirea audio, asigurându-se că conținutul generat de AI rămâne detectabil pentru a ajuta la prevenirea dezinformării.