Publicado em 2024-08-13
"As interrupções de TI não se referem apenas a períodos de inatividade; estão relacionadas à própria estrutura de resiliência e continuidade das empresas modernas", diz Josh Gordon, especialista em tecnologia da Geonode. Isso resume a importância da infraestrutura de TI no mundo digital atual. Como os sistemas de TI são críticos para a missão, as falhas podem ter consequências de grande alcance para milhões de usuários e causar graves danos financeiros e de reputação.
Aqui examinamos cinco dessas interrupções de TI de alto perfil, analisamos o que deu errado e discutimos sobre o futuro da resiliência de TI.
1. A crise de TI na British Airways (2017)
Em maio de 2017, uma falha catastrófica de TI forçou a British Airways a cancelar mais de 400 voos e deixou 75.000 passageiros presos. O apagão foi atribuído a uma subida de tensão que falhou em seu centro de dados. Relatórios da Reuters mostram que o incidente expôs uma companhia aérea sem um plano de recuperação implementado e com uma falta total de suprimentos de energia redundantes, além de sistemas abrangentes de backup.
Lições aprendidas:
A violação de dados da Equifax (2017)
Embora tradicionalmente não seja considerada uma interrupção de TI, a violação de dados da Equifax em 2017 foi uma das maiores falhas de cibersegurança da história. Expôs as informações pessoais de 147 milhões de pessoas devido a uma vulnerabilidade em uma única aplicação web. Foi causado por processos inadequados de gerenciamento de patches e por não criptografar dados confidenciais.
Lições aprendidas:
A interrupção do Google Cloud (2019)
Em junho de 2019, o Google Cloud sofreu uma interrupção de grande escala. Segundo o TechHQ, vários serviços foram afetados, desde os serviços da empresa, como Gmail e YouTube, até aplicativos de terceiros que dependem do Google Cloud. A causa foi uma má configuração da rede. Este incidente demonstrou quantas empresas dependem dos fornecedores de nuvem.
Lições aprendidas:
A interrupção do Facebook (2021)
No dia 4 de outubro de 2021, o Facebook e os serviços associados, como Instagram e WhatsApp, estiveram inativos por quase seis horas. Foi devido a um erro de configuração nos roteadores principais da empresa, que interrompeu o fluxo normal do tráfego de rede. Não apenas as comunicações de bilhões de usuários foram abruptamente interrompidas, como também este incidente expôs as vulnerabilidades dos serviços centralizados.
Lições aprendidas:
A interrupção massiva de TI (2024)
Em julho de 2024, uma interrupção massiva de TI afetou aeroportos, empresas e emissoras em todo o mundo. As paradas em terra foram ordenadas pelas principais companhias aéreas, incluindo American, Delta e United, todas alegando problemas de comunicação. A interrupção foi causada por uma falha crítica em um serviço de comunicação de rede de uso geral. Este incidente perturbou os planos de viagem de milhares de pessoas, afetou as cadeias de suprimentos globais e causou enormes atrasos operacionais em múltiplas indústrias.
Lições aprendidas:
Avançando: criação de sistemas de TI resilientes
Ao observar cada uma dessas importantes interrupções de TI, o futuro da resiliência de TI estava claro: planejamento proativo e estratégico. "O futuro da TI é a resiliência proativa: antecipar e mitigar possíveis pontos de falha antes que se tornem um desastre", declara Josh Gordon da Geonode.
É necessário seguir em frente e as organizações devem adotar o seguinte em termos de um enfoque multifacetado para a resiliência de TI:
Assim, as empresas podem continuar no caminho da adaptabilidade no futuro e garantir que sua infraestrutura de TI seja sólida e confiável, focando nessas áreas e aprendendo com incidentes passados.
COMENTÁRIOS
Sem comentários de clientes no momento.