Indice dei contenuti
È possibile essere il ‘campione dell’open source’ e allo stesso tempo stringere accordi miliardari con i giganti del cloud proprietario? La storia di Mistral AI, la startup di maggior valorizzazione del Vecchio Continente, è un intreccio di ambizioni sovraniste e pragmatismo commerciale. Nata per liberare l’Europa dal monopolio di OpenAI, Mistral si trova oggi a un bivio cruciale: mantenere le promesse di trasparenza che l’hanno resa celebre o soccombere alle stesse logiche di segretezza e profitto dei suoi rivali d’oltreoceano.
Le origini e la missione di indipendenza
Partiamo dall’inizio. Nel 2023 tre ricercatori provenienti da Google e Meta (l’attuale Ceo Arthur Mensch, Guillaume Lample e Timothée Lacroix) fondano l’azienda con una missione ambiziosa: ridurre la dipendenza europea dai grandi player statunitensi. In pochi mesi raccolgono il round seed più grande nella storia europea (105 milioni di euro) e rilasciano Mistral 7B tramite torrent, dimostrando che un modello compatto può competere con soluzioni molto più grandi.
L’anno successivo arriva Mistral 8x7B, che porta l’architettura Mixture of Experts (MoE) nel mercato di massa e diventa un riferimento globale per l’AI efficiente e open-weight. Entro fine anno la valutazione supera i 5 miliardi di euro grazie anche a partnership con Microsoft e NVIDIA.
Il ‘segreto’ è stato che chiunque poteva scaricare l’intero ‘cervello’ del modello, studiarne i pesi, farlo girare sui propri server e modificarlo senza dover chiedere il permesso o pagare l’azienda. Era la bandiera di Mistral AI contro la segretezza, o meglio il black box, di OpenAI o di Gemini.
La tensione tra idealismo e necessità di mercato
Quest’anno l’azienda ha pubblicato, qualche settimana fa, il whitepaper ‘European AI: a playbook to own it’, un manifesto politico e tecnico (di cui parleremo in un prossimo articolo) che propone visti dedicati ai talenti dell’AI e un mercato unico digitale privo di barriere. La valutazione intanto supera i 14 miliardi di euro e i ricavi raggiungono il miliardo, consolidando Mistral come primo vero ‘decacorno’ dell’AI europea. Ma questo è l’anno in cui si evidenzia un disallineamento tra la vocazione europea e la realtà dei fatti: Mistral si appoggia pesantemente al cloud di Microsoft o di AWS, e utilizza le CPU di Nvidia, campioni americani leader nei rispettivi comparti.
Parallelamente, Mistral sta ricalibrando la strategia sui modelli di punta: le versioni più avanzate (ad esempio Mistral Large 2 e i modelli ottimizzati per il ragionamento) non sono più distribuite liberamente, ma accessibili tramite API a pagamento o attraverso piattaforme partner come Microsoft Azure.
Non che questo sia incomprensibile o ingiustificato: per addestrare questi modelli servono centinaia di milioni di euro in hardware (GPU) e rilasciare gratuitamente il modello più potente renderebbe difficile per Mistral recuperare l’investimento, poiché i concorrenti o le grandi aziende potrebbero usarlo senza pagare un centesimo.
La svolta ha suscitato critiche da parte di sviluppatori e utenti: una società nata come riferimento europeo dell’apertura sta adottando un modello simile a quello di OpenAI, Google (Gemini) e Anthropic (Claude), basato su servizi chiusi di cui non è verificabile nel dettaglio il funzionamento e per i quali si paga in base all’utilizzo.
Ma allora perché utilizzare Mistral AI
Ciò nonostante, per un’azienda europea, ma anche per una multinazionale che opera massicciamente nel mercato UE, la conformità al GDPR e all’AI Act è una priorità legale e usare modelli americani spesso implica il trasferimento di dati su server soggetti al Cloud Act statunitense, che permette alle autorità USA di accedere ai dati in determinate condizioni. Mistral invece permette l’implementazione ‘on-premise’ o su cloud europei, garantendo che i dati non lascino mai la giurisdizione UE.
Un’impresa può prendere il modello Mistral (ad esclusione degli ultimi sotto il profilo cronologico) e addestrarlo sui propri dati proprietari (documenti legali, manuali tecnici, codice sorgente) in un ambiente totalmente isolato. Senza subire nessun lock-in: una volta scaricato il modello, l’azienda ne è proprietaria e può farlo girare autonomamente per sempre.
Meno GPUnit e meno consumi grazie al MoE
Grazie poi all’architettura Mixture of Experts (MoE), i modelli di Mistral consumano meno memoria e potenza di calcolo. Questo si traduce in bollette cloud più basse o nella possibilità di far girare l’AI su hardware aziendale meno costoso. Inoltre, modelli più snelli rispondono più velocemente, un fattore critico per applicazioni industriali, customer service in tempo reale o integrazioni in dispositivi edge (IoT).
Infine, Mistral è progettata per essere nativamente multilingue e più neutra rispetto ai dibattiti culturali statunitensi. Per un’impresa che opera in Italia, Francia o Germania, ciò significa un’AI che comprende meglio le sfumature linguistiche e i contesti normativi locali senza dover passare per una ‘traduzione’ concettuale made in USA.
Prospettive future per la sovranità digitale europea
Quale direzione prenderà nei prossimi anni Mistral AI, stretta tra vincoli regolatori europei e la necessità di sostenere investimenti tipici di una scala globale? L’evoluzione dell’azienda evidenzia una tensione strutturale tra l’idealismo delle origini e le esigenze economiche dei modelli di frontiera. Più che un ‘tradimento’, la chiusura dei sistemi più avanzati può essere letta come una scelta pragmatica: i costi di addestramento richiedono capitali che, nella pratica, vengono finanziati soprattutto tramite API e licenze.
L’annuncio dell’apertura di data center di proprietà sul suolo europeo rappresenta un passaggio chiave verso una maggiore autonomia industriale. Oggi, anche quando un modello è disponibile in forma aperta, l’esecuzione su infrastrutture cloud controllate da operatori extra-UE può esporre utenti e imprese a rischi di natura giuridica e operativa. L’integrazione verticale, dalla progettazione del modello alla disponibilità della capacità di calcolo, consente a Mistral di rafforzare le garanzie di riservatezza e di continuità del servizio. In questo quadro, la scelta di mantenere chiusi i modelli più avanzati potrebbe risultare più accettabile per regolatori e settori strategici, nella misura in cui i sistemi siano ospitati e governati all’interno della giurisdizione europea.
Resta da vedere se tale impostazione basterà a ricomporre, nel tempo, il rapporto con la comunità che ne ha sostenuto la crescita.
di Massimo Bolchi