Na tarde da segunda-feira, 04, o Facebook e suas plataformas Instagram e WhatsApp sofreram um apagão global de mais de seis horas. Na noite do mesmo dia do ocorrido o Facebook divulgou uma nota, informando que houve uma falha interna, uma mudança nas configurações, e tranquilizou os usuários informando que não houve nenhum ataque hacker e nem vazamento de dados dos usuários.
Segundo a empresa a instabilidade se deu por conta de uma mudança em uma estrutura que coordena o tráfego entre seus centros de dados, o que gerou um efeito cascata que interrompeu a comunicação e fez com que outros centros fossem afetados. Por meio de nota o Facebook lamentou aos seus usuários os transtornos causados pelo apagão.
A empresa não especificou quem executou a alteração na configuração e se essa mudança estava planejada. De acordo com funcionários, que não quiseram ser identificados disseram que acreditavam que a interrupção foi causada por um erro interno no modo como o tráfego da Internet é roteado para seus sistemas
Nota do Facebook
A todas as pessoas e empresas em todo o mundo que dependem de nós, lamentamos o transtorno causado pela interrupção de hoje em nossas plataformas. Temos trabalhado o máximo que podemos para restaurar o acesso e nossos sistemas estão funcionando novamente. A causa subjacente dessa interrupção também afetou muitas das ferramentas e sistemas internos que usamos em nossas operações diárias, complicando nossas tentativas de diagnosticar e resolver o problema rapidamente.
Nossas equipes de engenharia aprenderam que as alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam essa comunicação. Essa interrupção no tráfego de rede teve um efeito cascata na maneira como nossos data centers se comunicam, interrompendo nossos serviços.
Nossos serviços estão novamente online e estamos trabalhando ativamente para devolvê-los totalmente às operações regulares. Queremos deixar claro neste momento que acreditamos que a causa raiz dessa interrupção foi uma alteração de configuração com defeito. Também não temos evidências de que os dados do usuário tenham sido comprometidos como resultado desse tempo de inatividade.
Pessoas e empresas em todo o mundo confiam em nós todos os dias para se manterem conectadas. Entendemos o impacto que interrupções como essas têm na vida das pessoas e nossa responsabilidade em mantê-las informadas sobre interrupções em nossos serviços. Pedimos desculpas a todos os afetados e estamos trabalhando para entender mais sobre o que aconteceu hoje para que possamos continuar a tornar nossa infraestrutura mais resiliente.
A nota foi assinada por Santosh Janardhan, engenheiro de infraestrutura.