O apagão cibernético da última sexta-feira, 19, que atrosou voos e provocou instablidades no sistema bancário e no funcionamento de tvs por todo o mundo, foi provocado por uma falha durante a instalação de uma atualização no sensor "Falcon", da CrowdStrike.
Após o apagão diversos questionamentos passaram a ser feitos pelo público, antes da informação da falha ser divulgada pela própria empresa. Será que foi um ataque hacker? Será que foi algo relacionado a desastres naturais? Tem haver com o que muito se fala das erupções solares? Entre outras séries de perguntas que podem ter sido feitas.
Para entender um pouco mais sobre o apagão cibernético de sexta-feira, a nossa equipe conversou com o consultor e especialista em segurança cibernética, Pedro José Silva dos Santos. Ele explicou que o sensor é o antivírus, e que a falha ocorrida foi em decorrência de um bug, o qual não foi percebido pelos analistas durante os processos de testes antes de implementar a nova atualização, o que sugere uma falha humana no processo.
"Porque a atualização que foi provida para esses programas ele continha um bug, conforme o CEO da CrowdStrike em uma entrevista. E, isso indica claramenta que houve um problema no processo de mudança, e esse problema foi no momento de pré-testagem, a implementação".
O especialista salienta que todo processo de mudança ou de atualização seja em uma empresa de Tecnologia da Informação (TI) ou empresas que usam esses serviços, os ambientes de testes são robustos e se algo der errado como o caso da CrowdStrike, o mesmo já será visto durante os testes.
"Quando a gente tem um problema em que todas as máquinas são afetadas, algo de errado ocorreu no momento de pré-testagem, porque isso deveria ser evidenciado. Se é algo tão fácil de dar errado como foi, tão fácil seria também no ambiente de testagem, mas algo de errado aconteceu, não sabemos obviamente aonde foi, mas temos indícios de que foi ali. Esse processo de mudança é bem robusto ele demanda a aprovação de pessoas que geranciam e que usam esses sistema, para que você possa de fato fazer uma alteração nele, ele demanda que você detalhe passo a passo que você vai seguir para implementar, detalhe como será a validação e a testagem pré e pôs implementação demanda quem vai validar os testes, então você tem ali um comitê de individuos que vão julgar essa mudança, vão julgar o risco delas, e vão aprovar ou não dela acontecer".
Para que não ocorra nenhum tipo de problema como o de ontem, Pedro diz que é necesário que as empresas tenham criérios definidos e com atenção apurada para ter um processo de implementação e atualização saudável de um software.
Testes são fundamentais para evitar qualquer indisponibilidade ou ataques cibernéticos
Pedro José salienta que para evitar que apagões como o de sexta, ou outros problemas relacionados a esta falha aconteça é necessário que sejam feitos testes. Segundo ele, os sistemas de monitoramento não conseguem lhe dar com erros processuais, os quais são impostos a eles pelos próprios donos. Afinal esses sistemas estão ali para buscar intervenções indesejadas dentro do próprio sistema.
"Neste sentido, testes são fundamentais, e que tipos de testes? A gente tem testes tanto operacionais como os testes de segurança. Você deve rodar o seu produto sobre o ponto de vista da experiência do usuário, do funcionamento, da eficiência do seu programa, da segurança dele, segurança dinâmica quando está em funcionamento ou estática com análise do seu código fonte, e você tem um teste robusto. E geralmente esses testes são feitos por outros programas, especializados apenas nisto, e isso tudo demanda um processo, além do processo de mudança, você precisa também de um processo que vai definir as melhores práticas de um ambiente saudavel".
O consultor afirma que esses testes vão permitir definir quais sistemas terão alta disponilbilidade, e evitar por exemplo que em determinada região geográfica sofra com algum tipo de indisponibilidade ou ataque cibernético.
"Então você precisa ter ali previsto nesse processo rotinas de backup, registros do funcionamento do seu programa, do seus disposistivos, você precisa ter uma definição de alta disponibilidade, uma política que vai regir quais sistemas vão ter alta disponibilidade, caso um sistema em determinada região geográfica sofra uma indisponibilidade ou um ataque, para que você não perca a produção você vire a chave da produção para o outro sistema que está esperando para ser ativado, mas com todas as confirugações que o outro tinha. E este processo em geral, ele vai gerir uma prática de saúde e segurança do ambiente".
Risco de colapso cibernético provocado por erupções solares é real
A reportagem aproveitou também para falar sobre a questão que envolve as erupções solares, que podem provocar indisponibilidade nos nossos aparelhos eletrônicos e em satélites. Para o consultor o risco de uma erupção solar nos afetar é crescente pelo fato de que nós somos dependentes de ferramentas tecnológicas para comunicação, trabalho e lazer.
"Sim, como dissemos esse risco ele é crescente. Nossa dependência de ferramentas tecnológicas para comunicação, trabalho para lazer, e a evolução desses meios tecnológicos em grandes sistemas complexos e interdependentes, faz com que seja de extrema necessidade a identificação dos pontos mais cruciais para defesa. Sistemas de infraestrutura são essenciais para que uma indisponibilidade geral não venha a tomar conta do mundo. Como por exemplo o caso da utilização do sistema cloud, sistemas de nuvem, eles são compartilhados entre várias e grandes empresas, então uma empresa de nuvem, que venha a ficar indisponível pode causar um desatre similar se não muito maior do que este que vimos no caso da CrowdStrike. Obviamente, existe a necessidade de você trabalhar a sua dependência desses sistemas, de forma que você distribuia a sua dependência em diferentes fornecedores, sejam eles fornecedores de cloud, seja de antivírus, de TI em geral, para que caso um deles venha ficar indisponível, você não pare as suas produções por completo certo".
Dos santos afirma que ao identificar esses pontos fracos é crucial para que possamos aumentar as suas defesas, principalmente quando falamos de desastres naturais, que são muito dificeis de combater conforme pontua o especialista.
"Então, identificar estes pontos fracos, embora muito importantes na cadeia tecnologica é crucial para a gente aumentar a defesa deles, ainda mais quando estamos falando de desastres naturais, que são iminentes e tem uma força que é muito difícil de combater, quando estamos falando de erupções solares, estamos falando de um fênomeno natural muito poderoso. As erupções solares lançam na atmosfera particulas carregadas eletricamente, que pela sua velocidade, que pela sua movimentação gera correntes induzidas por onde elas estão, essas correntes se induzidas em equipamentos tecnologicos podem comprometer imediatamente porque vão ser correntes muito intensas, muito maiores do que as suas especificações. Como também por exemplo satélites que estão na camada mais alta, podem ser atingidos com ventos solares e alta radição, radição de raios gamas, de raios x, que vão impedir a comunicação com eles, e degradar paineis solares destes satelites, causar curto circuitos ali, tudo isso pode ser muito desastroso por que a nossa dependência desse sistema é imensa".
Ao ser questionado qual o caminho que devemos seguir para evitar que apagões como que foi registrado, o consultor afirma que é preciso ter investimento em sistemas mais eficazes para evitar um novo apagão.
"Existe essa possiblilidade, mas também não há como se prevenir completamente, a gente precisa investir em desenvolvimento de sistemas mais eficazes, cada vez mais eficazes, não dá para falar de sistemas eficazes em relação aos nossos, porque os próximos serão ineficazes em relação aos do futuro, ter uma mentalidade de evolução constante é necessário, e é necessário também para pesquisa e desenvolvimento. Você sempre buscar o melhor, sempre buscar evoluir, em conjunto com quem está buscando melhorar e evoluir, buscar parcerias com as academias, buscar parcerias com outras empresas do setor, sejam elas da sua regão ou internacional, faz com que o conhecimento seja compartilhado, para que processos melhores sejam desenvolvidos, dispositivos mais robustos sejam concebidos, e que a nossa resiliência aumente".
O especialista afirma que outro ponto importante para tentar nos proteger de um apagão como o da CrowdStrike, é a comunicação e o alerta tanto por parte de funcionários dessas empresas entre eles, como com pessoas fora do ambiente de trabalho deles.
"Outro ponto crucial como caminho para que a gente siga é comunicar, alertar e educar os funcionários e o povo, o povo tem papel fundamental nisso também porque ele é afetado com isso certo, então, entender como funciona os processo de TI, de segurança, como se resguardar de ataques cibernéticos, pode fazer com que os funcionários dentro de casa, dentro da empresa, se resguardam a si mesmos quanto a própria empresa, e as pessoas fora da empresa se resguardam de ataques a elas mesmas, e também de influências, de indisponilibidades como a gente conheceu hoje com o caso da CrowdStrike né, é isto!"