di Monica Gianotti
Meta ha svelato i dettagli della sua prossima generazione di chip AI che consentirà all’azienda di ridurre la sua dipendenza dai chip AI di Nvidia e a ridurre i costi energetici complessivi. Una mossa necessaria per far fronte all’enorme quantità di potenza di calcolo necessaria per far funzionare i prodotti AI di Facebook, Instagram e WhatsApp.
Il chip è l’ultima versione del Meta Training and Inference Accelerator (MTIA) a cui la big tech sta lavorando dal maggio dell’anno scorso. La sua architettura è fondamentalmente orientata a fornire il giusto equilibrio tra calcolo, larghezza di banda e capacità di memoria.
Questo chip avrà infatti 256 MB di memoria on-chip e 1,3 GHz rispetto ai 128 MB e 800 GHz del precedente. I primi risultati dei test condotti hanno dimostrato che Artemis – così è chiamato internamente dall’azienda – ha prestazioni tre volte superiori rispetto alla versione di prima generazione in quattro modelli valutati dall’azienda.
“Si tratta di un investimento che prevediamo crescerà negli anni a venire, dato che i requisiti di calcolo per supportare i modelli di IA aumentano di pari passo con la loro sofisticazione. Attualmente sono in corso diversi programmi volti ad ampliare la portata di MTIA, compreso il supporto per i carichi di lavoro GenAI. E siamo solo all’inizio di questo viaggio”, ha scritto in un blogpost l’azienda.
La concorrenza per l’acquisto di chip potenti ha evidenziato la necessità di disporre di chip personalizzati per l’esecuzione di modelli di IA. La domanda di chip è cresciuta a tal punto che Nvidia, che domina il mercato, è oggi valutata 2.000 miliardi di dollari.