Interactive

CrowdStrike blocca i computer in tutto il mondo per un aggiornamento non riuscito. Ma la ridondanza che fine ha fatto?

Blue Screen of Death
di Massimo Bolchi

Sappiamo tutti, ormai, quello che accaduto venerdì. Un’interruzione tecnologica globale ha bloccato i voli, interrotto i servizi sanitari, mandato in tilt i sistemi di pagamento, bloccato gli ospedali: in poche parole è stato impedito l’accesso ai servizi Microsoft in quello che gli esperti ritengono essere uno dei più grandi guasti informatici della storia. Milioni di computer che mostravano, all’accensione, un ‘Blue Screen of Death’ (BSoD) e rifiutavano di procedere con il caricamento di Windows.

La causa delle interruzioni è da ricercare in un’azienda di cybersicurezza chiamata CrowdStrike, che fornisce software a un’ampia gamma di settori. L’azienda ha dichiarato che un aggiornamento di uno dei suoi software Falcon Sensor – si è guastato, causando un malfunzionamento dei computer con sistema operativo Windows e provocando gravi guasti tecnologici in tutto il mondo.

Questa interruzione era stata preceduta un disservizio dei cloud di Azure, concentrata soprattutto negli USA, un disservizio di non lieve entità, ma subito superato, per i suoi effetti da quello di CrowdStrike, tanto che, alla fine del pomeriggio di venerdì Satya Nadella, Ceo di Microsoft, scriveva in un twitt: “CrowdStrike released an update that began impacting IT systems globally. We are aware of this issue and are working closely with CrowdStrike and across the industry to provide customers technical guidance and support to safely bring their systems back online”, bypassando ‘bellamente’ la defaillance di Azure, mentre il Ceo di CrowdStrike, George Kurtz, doveva profondersi in scuse e promesse di rapida risoluzione: i problemi tuttavia, nella giornata di sabato, erano ben lungi dall’essere risolti.

Com’è potuto succedere?

Problemi che, comunque, sono stati identificati e parzialmente risolti, ma – al di là della facile battuta degli esperti: ‘mai fare un aggiornamento di venerdì’ – non interessa tanto fornire un risposta tecnica, ma una quasi filosofica: come è potuto succedere che un programma di servizio mettesse fuori uso i computer su una scala così gigantesca? Poiché gli endpoint che si erano bloccati – con la comparsa del Blue Screen of Death – non potevano essere aggiornati da remoto, il problema doveva essere risolto manualmente, endpoint per endpoint. Si prevede che questo processo richiederà giorni, come scrive il Cio di CyberArk, Omer Grossman, che in un commento a caldo paventava anche la più preoccupante possibilità di un attacco hacker profondo, preparato in anticipo e che prevedeva l’attivazione di un ‘doomsday command’ o ‘kill switch’. Ma cose sappiamo oggi, non è questo il caso.

Ma, oltre alla preoccupazioni espresse dalle più svariate entità, dalle associazioni che protestano perché non sono i consumatori a dover pagare gli errori delle Big Tech, ai politici ed esperti che chiedono un cloud europeo, rimane la domanda centrale che è passata un po’ sotto traccia: ma la ridondanza, che fine ha fatto?

Occorre riportare un po’ di ridondanza nel sistema di business di internet

Arcanet, il progenitore di Internet, è stata sviluppata come applicazione militare per essere sempre utilizzabile, con i pacchetti di dati che erano in grado di raggiungere i propri destinatari in presenza di un attacco atomico che faceva letteralmente saltare per aria i nodi intermedi, e oggi basta un programmatore che commette un errore per paralizzare le rete di computer mondiale? La risposta purtroppo è ‘sì, basta un tecnico ‘sbadato’ e viene giù tutto’. Perché nonostante lo straparlare che si è fatto di ‘fail proof’ e ‘fail safe’, la ricerca del profitto ha portato a una estrema concentrazione nei cloud delle attività di tutto il mondo, fatti salvi quei paesi come la Cina che hanno una ‘loro’ internet, e ad affidarsi a imprese specializzate per i servizi, come CrowdStrike, che non hanno nemmeno pensato a una strategia alternativa nel caso qualcosa non funzionasse. Come per le funivie: il cavo non può cedere per definizione, ma poi quando cede sono decine le persone che vanno di mezzo.

Occorre riportare un po’ di ridondanza nel sistema di business di internet: ridondanza significa disporre di strategie alternative che non verranno mai utilizzate – e sono perciò una perdita secca dal punto di vista economico – tranne nel caso che fossero necessarie, per porre rimedio a un evento ‘impensabile’, talmente impensabile che è accaduto veramente. Certo è economicamente più efficiente ‘forzare’ gli aggiornamenti dell’antivirus su tutti i milioni di computer collegati in rete, ma equivale e fare le acrobazie al circo senza rete. E se qualcosa va storto…

Qui siamo di fronte a una scelta ‘fail proof’, ideata per essere a ‘prova di guasto’: in altre parole non dovrebbe guastarsi mai, indipendentemente dalle condizioni. Ma se si guasta, non abbiamo alternative oltre a rimettere pazientemente la cose a posto manualmente, impiegando giorni o settimane. Non ci sembra la scelta migliore quando i computer sono connessi a cloud giganteschi che per definizione non dovrebbero guastarsi mai. Appare come distopica, ma oltremodo reale per chi era in coda magari per prenotarsi in un ospedale, la visione terrificante di Trantor, la capitale dell’Impero di Issac Asimov, dove le centrali nucleari erano progredite a tal punto da non guastarsi mai, per cui i tecnici non sapevano più ripararle, e in caso di guasto si limitavano a chiuderle, una dopo l’altra.

Ma in ogni caso, per adesso, ricordatevi tutti il saggio motto: mai fare un aggiornamento di venerdì…

Chi è CrowdStrike

CrowdStrike è un’azienda americana di sicurezza informatica fondata nel 2011 con sede ad Austin, in Texas. Dalla sua nascita, l’azienda è cresciuta rapidamente, iniziando a offrire una serie di servizi di sicurezza utilizzando un software basato sul cloud. Ha raccolto milioni di finanziamenti da potenze della Silicon Valley come il ramo di venture capital di Google. Impiega migliaia di lavoratori e fornisce servizi alle aziende in tutto il mondo, vantando sul proprio sito web di proteggere 538 delle aziende Fortune 1000.

Il valore di mercatodell’azienda è di circa 83 miliardi di dollari alla chiusura del mercato di giovedì, anche se il prezzo delle azioni è sceso durante le contrattazioni di venerdì arrivando a un -13% nelle contrattazioni borsistiche.