Interactive

La compressione delle reti neurali e l’AI in tasca. Questo il futuro a portata di smartphone

Le reti neurali imitano il cervello umano: in particolare uno dei modi in cui il cervello funziona, accumulando astrazioni più piccole per arrivare a “comprendere” astrazioni più grandi.

Ragionare per astrazioni è una cosa naturale per il cervello umano, ma le reti neurali che lo imitano dovo lavorare per raggiungere questo livello di competenza. A imitazione dell’organo umano, le reti neurali sono costituite da blocchi chiamati “neuroni” che sono collegati in vari modi, ispirandosi all’encefalo ma non imitandolo direttamente. Ogni neurone può rappresentare un attributo o una combinazione di attributi, che la rete prende in considerazione a ogni livello di astrazione.

Quando questi neuroni si combinano, si può avere un progresso nell’identificazione di ciò che è oggetto dell’esame. Si pensi, per esempio, a una rete neurale che ha il compito di riconoscere oggetti nelle immagini. L’immagine entra nel sistema al primo livello. Al livello successivo, la rete potrebbe avere neuroni che rilevano solo i bordi dell’immagine. Lo strato ancora successivo combina le linee per identificare le curve nell’immagine. Quindi il livello seguente combina le curve in forme e trame, e il livello finale elabora le forme e le trame per giungere a una conclusione su ciò che sta guardando.

I progettisti devono anche decidere la “larghezza” di ogni strato, che corrisponde al numero di diverse caratteristiche che la rete prende in esame a ogni livello di astrazione. Nel caso del riconoscimento dell’immagine, la larghezza dei livelli sarebbe il numero di tipi di linee, curve o forme che esamina in ogni livello.

“Questa rete neurale evoluta”, spiega Leonardo Chiariglione, rappresentante dell’Ente nazionale di normazione per le tecnologie informatiche (Uninfo), “può essere molto pesante. Di qui l’utilità dell’algoritmo di compressione: una rete neurale evoluta, che può pesare un giga, noi potremmo farla diventare di 100 o 10 megabyte”. Trasformata in file maneggevoli, verrebbe meno la necessità di dover elaborare algoritmi molto pesanti. Parliamo di un ordine di grandezza che è inferiore di 20 o 40 volte”.

L’ing Chiariglione, per completezza dell’informazione, è uno dei padri dell’Mpg3, lo standard alla base del successo mondiale dei file audio. Il nuovo standard di compressione per le reti neurali, invece, ha ancora un nome in codice, Nnc (Neural network compression), in attesa di ricevere il battesimo ufficiale. Secondo Chiariglione, la necessita di comprimere le reti neurali deriva dalla poco fattibilità di una struttura decentrata, con l’AI che risiede sul cloud centralizzato e un terminale “stupido” che accede alla risposte elaborate.

“Secondo me una struttura di questo genere, tipo client-server per intenderci, non potrà funzionare neppure con il 5G di prossimo arrivo. Innanzitutto perché la latenza, seppure molto ridotta non verrà azzerata, e per alcune missioni critiche qualsiasi ritardo nella risposta è impensabile, Inoltre la disponibilità di una rete 5G non sarà garantita ovunque, quindi ci si troverebbe con dei “buchi” geografici nelle capacità dei terminali, e nessuno sarà disposto ad accettarli, al di là del fatto che potrebbero non essere funzionalità indispensabili. Infine, vi è una questione legata all’appetibilità commerciale dei terminali, che a ogni generazione sono sempre più potenti e in grado di fare un numero più elevato di di cose. Questa corsa al maggior valore aggiunto, sui terminali mobili ma anche sulle autovetture, è irreversibile”.

Lo standard in corso di sviluppo abiliterà quindi la distribuzione dell’intelligenza delle reti neurali così come l’Mp3 ha abilitato la distribuzione della musica nella Rete. “Pensiamo al riconoscimento automatico degli oggetti inquadrati, alle traduzioni istantanee, alla videosorveglianza: tutte operazioni che si potranno svolgere direttamente sullo smartphone, quello che abbiamo normalmente in mano”.

Vi sta lavorando la stessa struttura che ha realizzato l’Mp3, insieme ad alcune università e a due multinazionali, una cinese e una del nord Europa: un ente di standardizzazione, che prende brevetti di altri per combinarli fra loro.

“Ma non sempre le scoperte vanno nella direzione voluta”, conclude Chiariglione. “Prendiamo Google Traslate, che oggi usiamo tutti. È una rete neurale “stupida” rispetto a quella largamente finanziata dall’Unione Europea, che doveva basarsi sul significato dei termini per poi tradurli nelle diverse lingue. Eppure Google Translate funzione sempre meglio, mentre degli altri esperimenti si è praticamente persa traccia”.