Interactive

Il lancio di Gemini è un flop per Google: il video della nuova AI è stato ‘corretto’ e i social hanno già sentenziato inappellabilmente. È un fake, nonostante le spiegazioni

di Massimo Bolchi

Il 7 dicembre 2023, Google ha lanciato Gemini, un nuovo modello di intelligenza artificiale multimodale: questo lancio era stato preannunciato da Sundar Pichai, CEO di Google e Alphabet, in occasione della conferenza I/O di giugno 2023. La attese per la risposta di Google a ChatGPT-4 erano ovviamente molto alte: Gemini è un modello di intelligenza artificiale che può comprendere e generare testo, immagini, video e audio. È stato addestrato su un dataset di 1,56 trilioni di parametri, che è circa 10 volte più grande del dataset utilizzato per addestrare il precedente modello di punta di Google, PaLM2.

Gemini è (o sarà) disponibile in tre versioni: Ultra, Pro e Nano. La versione Nano è stata integrata nel chatbot Bard di Google, mentre la versione Pro è stata utilizzata per migliorare le funzionalità di registrazione e risposta automatica dello smartphone Pixel 8 Pro. Gemini Ultra, che non sarà disponibile almeno fino alla metà del 2024, ed è quella che secondo l’azienda ha ottenuto un punteggio superiore a qualsiasi altro modello, compreso GPT-4, in alcuni test di benchmark, e richiede ulteriori test prima di essere rilasciata a ‘clienti selezionati, sviluppatori, partner ed esperti di sicurezza’ per ulteriori test e feedback.

Ma tutto questo è ormai parte del ‘passato’ di Gemini, perché il video di lancio dell’AI di Google è un fake, uno ‘staged video’: un disastro comunicativo che farà sentire in suoi effetti a lungo, a partire da Wall Street, dove il titolo di Alphabet ha perso oltre il 2% nelle contrattazioni di venerdì.

Perché sono le immagini a parlare: nel video di lancio, un utente esegue una serie di compiti, come cercare di nascondere una palla in una tazza, disegnare una papera e giocare con una mappa. Nel corso del filmato, Gemini racconta in tempo reale ciò che sta accadendo, capendo tutto al volo. Almeno così sembra. Quello che non si vede nel video, tuttavia, è che Google ha utilizzato suggerimenti testuali e fornito un contesto per realizzare la demo di Gemini. La narrazione a completare il tutto è stata aggiunta in seguito.

Anche i suggerimenti mostrati nel video non sono nemmeno quelli dati in realtà a Gemini. Nel video sembra che Gemini veda tre tazze poste su un tavolo e capisca immediatamente che l’utente sta cercando di giocare. In realtà, Google ha addestrato Gemini a giocare. Poi ha testato la capacità di Gemini di seguire istruzioni molto specifiche. Perfino con queste precauzioni, Gemini non è stata perfetta nell’eseguire il suo compito.

Google ha ammesso che il video ‘Hands-on with Gemini: Interacting with multimodal AI’ è stato modificato per accelerare le risposte, come dichiarato nella descrizione del video, ma la differenza tra quanto promesso e la realtà è stata troppo grande per fare finta di nulla: perché l’AI è un argomento caldo in questo periodo, perché paragonare qualcosa di esistente da alcuni mesi (ChatGPT-4) con un prodotto che sarà disponibile tra almeno sette mesi è scorretto, perché altre AI (Orca-2, Pi-2) sono già comparse nell’arena competitiva, che rischia di essere molto diversa dal duopolio odierno (in larga parte fittizio, peraltro).

Per fare una prova, abbiamo chiesto a Bard delle polemiche successive al lancio dell’AI di Google. Oltre a una allucinazione, il riferimento a un fantomatico comunicato di Google rilasciato il 14 dicembre in risposta a una domanda espressa il 9 dicembre, l’impressione ricevuta dalle risposte (più di una) è stata sufficientemente equanime (a nostro giudizio, s’intende): “L’azienda ha ammesso che i video erano stati modificati, ma ha affermato che le modifiche erano state apportate per motivi tecnici, per migliorare la qualità dei video e per evitare che si verificassero problemi tecnici durante la riproduzione. L’azienda ha anche affermato che le modifiche non avevano alterato il contenuto o il significato dei video”.

Ma anche “Le polemiche sul lancio di Gemini hanno sollevato una serie di questioni più ampie sulla trasparenza e l’etica della ricerca sull’intelligenza artificiale, sulla trasparenza dei risultati e sulle manipolazioni dei dati o dei risultati. Le polemiche hanno anche avuto un impatto negativo sulla reputazione di Google. L’azienda è stata accusata di aver cercato di nascondere gli errori di Gemini e di aver manipolato il pubblico”.

Ed è proprio questo aspetto che rappresenta l’errore imperdonabile di Google, su un terreno così scivoloso come l’AI: la perdita di fiducia. Può darsi che Gemini Ultra, quando la vedremo, faccia anche di più di quanto ci mostra il video, ma la dizione ‘it’s a staged video, don’t believe it’ aleggerà per sempre su questa AI. Ed è la seconda volta che accade all’azienda che una volta proclamava orgogliosamente ‘don’t be evil’ come proprio motto. A febbraio scorso, quando il Ceo Pichai svelò Bard, proprio una demo dell’intelligenza artificiale generativa conteneva un errore che fece perdere 100 miliardi di dollari di valore in Borsa all’azienda americana. Ma questa volta è andata peggio: i social – l’unico giudice che conta ormai – hanno già sentenziato.

Il futuro si presenta in salita per Gemini.