Meta Platforms a lansat un nou „model AI al lumii” (world model), destinat să îmbunătăţească înţelegerea mediului tridimensional şi a mişcărilor obiectelor fizice de către roboţi şi vehicule autonome, potrivit News.ro, care citează CNBC.
Gigantul tech, care deţine aplicaţiile de social media Facebook şi Instagram, a prezentat modelul său open-source V-JEPA 2, capabil să înţeleagă, să prezică şi să planifice în lumea fizică.
Acest tip de „model al lumii” îşi propune să reproducă logica lumii reale, creând o simulare internă a realităţii pentru ca inteligenţa artificială să poată învăţa, planifica şi lua decizii într-o manieră mai asemănătoare cu cea umană. De exemplu, V-JEPA 2 recunoaşte că o minge care cade de pe o masă va atinge pământul sau că un obiect ascuns privirii nu dispare pur şi simplu.
Inteligenţa artificială este o prioritate pentru Mark Zuckerberg, în condiţiile în care compania se confruntă cu o concurenţă acerbă din partea OpenAI, Microsoft şi Google.
Modelul V-JEPA 2 este promovat ca un instrument esenţial pentru roboţi de livrare şi maşini autonome, care trebuie să navigheze în lumea reală în timp real.
Meta a explicat că, spre deosebire de modelele tradiţionale care folosesc cantităţi mari de date etichetate sau filmări video, V-JEPA 2 raţionează într-un spaţiu simplificat „latent”, înţelegând cum se mişcă şi interacţionează obiectele.
„A permite maşinilor să înţeleagă lumea fizică este foarte diferit de a le face să înţeleagă limbajul”, a declarat Yann LeCunn, şeful AI de la Meta, la conferinţa Viva Tech de la Paris.
El a adăugat că „un model al lumii este ca un geamăn digital abstract al realităţii, pe care AI-ul îl poate consulta pentru a înţelege lumea şi a prezice consecinţele acţiunilor sale, putând astfel să planifice un curs de acţiune pentru a îndeplini o sarcină dată”.
Modelele AI de tip „world model” au atras tot mai mult interes în comunitatea de cercetare, deoarece specialiştii caută să depăşească modelele lingvistice care stau la baza aplicaţiilor generative precum ChatGPT de la OpenAI şi Gemini de la Google. În septembrie anul trecut, cercetătoarea AI Fei-Fei Li a strâns 230 de milioane de dolari pentru startup-ul World Labs, care îşi propune să creeze „modele mari ale lumii” pentru o mai bună înţelegere a structurii mediului fizic.
Între timp, divizia DeepMind a Google dezvoltă propriul model numit Genie, care poate simula jocuri şi medii 3D în timp real.