Interactive

Inflection-2, la nuova intelligenza artificiale di Inflection AI, già supera – secondo l’azienda – Google, Meta e Antropic, ed è seconda solo a Chat GPT-4. Iniziato il lavoro su un altro modello, cento volte più evoluto

Mustafa Suleyman, Mustafa Suleyman, CEO di Inflection AI
Mustafa Suleyman, CEO di Inflection AI
di Massimo Bolchi

Inflection AI, la startup che sta dietro il chatbot conversazionale Pi, ha presentato un nuovo modello di intelligenza artificiale chiamato Inflection-2. L’azienda sostiene che il modello supera i modelli PaLM Large 2 di Google e LLaMA 2 di Meta, diventando il secondo modello linguistico di grandi dimensioni più capace al mondo: Inflection-2, infatti, è ancora dietro a GPT-4 di OpenAI, ma l’azienda sta lavorando a un nuovo modello che prevede di essere 100 volte più grande di Inflection-2 e che sarà disponibile entro un anno.

Il nuovo modello Inflection-2 sarà presto integrato in Pi, il chatbot che Inflection ha rilasciato a maggio. Per prima cosa ha bisogno di un po’ di lavoro aggiuntivo, noto come ‘allineamento’, per insegnargli il tono e lo stile di risposta di Pi e per aiutare Pi a funzionare meglio assorbendo informazioni aggiornate senza ulteriori ‘allucinazioni’, come sono chiamate in gergo le risposte formalmente molto corrette ma assolutamente fantasiose che l’AI produce.

Inflection ha testato il suo nuovo modello contro un popolare benchmark di compiti di livello high school e professional noto come MMLU, in cui ai modelli vengono poste domande su 57 argomenti, dalla conoscenza del mondo alla risoluzione di problemi e all’etica. Il CEO di Inflection AI, il britannico Mustafa Suleyman, ha dichiarato che Inflection-2 ha superato la versione più grande, da 70 miliardi di parametri, di LLaMA 2, Grok-1 della startup xAI di Elon Musk, PaLM 2 Large di Google e Claude 2 della startup Anthropic, risultando seconda soltanto a GPT-4.

Il nuovo modello ha battuto i modelli LLaMA 2 e PaLM 2 in tutti i sette benchmark di risposta scientifica, tranne due, secondo quanto riportato da Inflection; ha inoltre ottenuto i migliori risultati in due dei tre benchmark di domande e risposte, perdendo con PaLM 2 Large in uno.

L’azienda ha aggiunto che in quattro benchmark di matematica e codice ha ottenuto un risultato ‘rispettabile’, nonostante queste aree non siano state oggetto di sviluppi mirati. Tuttavia, nei due benchmark per i quali OpenAI ha condiviso i risultati, Inflection-2 è rimasto notevolmente indietro rispetto a GPT-4. Complessivamente, Suleyman ha affermato che Inflection-2 può essere considerato il migliore della categoria per le sue dimensioni, “molto, molto vicino” a GPT-4.

A partire da oggi, Inflection si concentrerà sul suo prossimo modello, che raggiungerà una scala 10 volte superiore a quella del suo predecessore entro sei mesi, e un’altra 10 volte superiore in altri sei mesi: alla fine sarà cento volte più grande di adesso. Non resta che attendere.