Ormai è cosa nota, i social network Facebook e Instagram, nonché il sistema di messaggistica WhatsApp, con l’IM di Messenger, tutti di proprietà di Facebook, non hanno funzionato in quasi tutto il mondo per circa sei ore. Ora l’emergenza è superata e tutto ha faticosamente ripreso a operare correttamente, lasciando solo – come coda – una mail riassuntiva che il servizio di sicurezza interno aveva fatto girare tra i dipendenti: un messaggio che definiva “rischio ELEVATO per le persone, un rischio MODERATO per gli asset dell’azienda e un rischio ELEVATO per la reputazione di Facebook“.
Malfunzionamenti di uno o due dei tre servizi controllati da Facebook non sono molto rari, pur senza essere frequenti, ma è molto più raro che tutti e tre smettano di funzionare contemporaneamente. L’ultimo caso registrato risale all’aprile del 2019: anche in quell’occasione il blackout aveva coinvolto le tre piattaforme, ed era durato per diverse ore. Nel caso di lunedì, il problema sembra essere stato particolarmente complesso da gestire.
Sostanzialmente si è verificato un malfunzionamento dei BGP, i Border Gateway Protocol, che sono l’equivalente, semplificando al massimo e non ce ne vogliano gli specialisti, dei numeri di telefono, con area code e prefisso, per ‘instradare’ le richiesta dalle rete verso i DNS (Domain Name Sistem) appropriati secondo la via migliore.
Secondo John Graham-Cumming, CTO di Cloudflare – uno dei più importanti provider di servizi di rete al mondo – che ha parlato con il New York Times, il problema sarebbe stato in un cambio di configurazione dei BGP di Facebook. Graham-Cumming ha notato che appena prima dell’interruzione dell’operatività dei DNS di Facebook c’erano stati numerosi cambiamenti nei BGP, in quelli che vengono definiti ‘ritiri’ dei percorsi. Il problema, però, è stato più complesso rispetto a un semplice malfunzionamento dei DNS perché i protocolli BGP erano stati rimossi: in loro assenza il rischio è che nessun server DNS abbia più le coordinate giuste per poter rintracciare i numeri dei server.
Il problema, poi, è stato anche amplificato dalle policy di sicurezza – informatica e per il Covid – che hanno amplificato le ricadute dello smartworking dei dipendenti di Facebook: da un lato la necessità di riservare a un numero ridotto di esperti le conoscenze necessarie per gestire il core business di FB, dall’altro la presenza onsite di un numero ridotto di collaboratori non in grado o non autorizzati a intervenire sul problema. In più sembra che anche le stesse procedure di sicurezza impedissero ai dipendenti di Facebook di entrare negli edifici dove erano custoditi i server, perché gli stessi non erano ‘riconosciuti’ a causa del ‘down’ di Facebook. Una sorta di reazione a catena che ha fatto sì che il down si prolungasse per molte ore.
Non si sa esattamente perché i BGP fossero stati ritirati. I BGP, che esistono dall’avvento di Internet, possono essere manipolati e sfruttati in modi che possono portare a massicce interruzioni. E questo è stato il primo pensiero di molti, a partire dagli israeliani che hanno dichiarato subito ‘l’allerta cyber’ e hanno contattato gli USA per informarsi di più.
La cosa più probabile è che un aggiornamento della configurazione di Facebook non abbia funzionato e che questo errore si sia diffuso su Internet. Un thread Reddit ora cancellato da un ingegnere di Facebook ha descritto un errore di configurazione BGP molto prima che questa ipotesi fosse ampiamente nota.
A fornire una delle prime stime – quasi in tempo reale – sulle perdite riportate da Facebook, WhatsApp e Instagram nelle sei ore di inattività è stata la rivista Fortune, secondo la quale l’interruzione dei tre social avrebbe fatto registrare a Zuckerberg perdite pari a quasi 100 milioni di dollari (99,75 milioni di dollari la cifra esatta). Per essere rimasto inaccessibile e offline dal pomeriggio fino a tarda sera, Facebook ha quindi perso circa 20 mila dollari al minuto – poco più di 17 mila euro – in pubblicità e inserzioni sponsorizzate. Nell’ultimo trimestre, la società ha incassato circa 330 milioni di dollari al giorno, più che sufficienti a metterla al riparo da una perdita ingente che avrebbe messo in difficoltà quasi tutte le altre aziende.
Quello che pesa davvero su Facebook è l’udienza al Congresso statunitense in cui un’ex product manager, Frances Haugen, testimonierà sulla sua decisione di diventare una whistleblower e di fornire dati interni al Wall Street Journal. Ma questa è per ora un’altra storia…