Meta ha presentato V-JEPA 2, un nuovo modello di intelligenza artificiale progettato per migliorare la comprensione e la previsione del comportamento del mondo fisico. Si tratta di un ‘world model’, ovvero un modello che apprende osservando video, utile per rendere agenti e robot capaci di ragionare in ambienti reali. Si tratta – ha sottolineato Meta in un blogpost – di un passaggio importante verso lo sviluppo di sistemi di intelligenza artificiale avanzata (Advanced Machine Intelligence – AMI).
Per operare nel mondo reale, un’intelligenza artificiale deve saper prevedere come reagirà l’ambiente alle sue azioni. Questa capacità, che negli esseri umani si sviluppa in modo naturale, è fondamentale anche per i sistemi artificiali.
Meta fa alcuni esempi semplici: quando una persona lancia una palla, sa già che la gravità la riporterà a terra; in uno spazio affollato, evita gli ostacoli mentre cammina; in uno sport come l’hockey, si muove verso dove andrà il disco, non dove si trova ora. Questo tipo di comportamento si basa su una rappresentazione mentale del mondo costruita osservando la realtà e immaginando gli effetti di azioni ipotetiche.
V-JEPA 2: come funziona e cosa migliora
Un world model come V-JEPA 2 permette all’intelligenza artificiale di osservare, interpretare e prevedere ciò che accade nel mondo fisico. In pratica, consente all’agente di ragionare sulle possibili conseguenze delle proprie azioni prima di agire. Questo approccio è utile per sviluppare agenti più autonomi e capaci di adattarsi a situazioni nuove o complesse.
Rispetto alla versione precedente, V-JEPA 2 migliora sia la comprensione delle scene, sia la capacità di prevedere azioni future. Queste abilità permettono all’AI di affrontare ambienti e compiti non conosciuti in fase di addestramento.
Applicazioni pratiche nei robot
Meta ha testato V-JEPA 2 in ambienti reali, applicandolo a robot in grado di svolgere azioni come raggiungere un oggetto, raccoglierlo o posizionarlo in un altro luogo. Il modello consente ai robot di eseguire questi compiti anche in contesti nuovi, basandosi sulle previsioni apprese dai video.
Obiettivi futuri
Con questo lavoro, Meta punta a rendere disponibili modelli e strumenti utili per tutta la comunità scientifica, contribuendo così allo sviluppo di sistemi AI più robusti e versatili, capaci di operare in contesti reali e di supportare applicazioni concrete, migliorando la vita delle persone.