top of page

Amazon detalha causa de interrupção global de serviços

  • Foto do escritor: Cyber Security Brazil
    Cyber Security Brazil
  • há 1 hora
  • 2 min de leitura

ree

Milhões de usuários em todo o mundo enfrentaram a inacessibilidade de inúmeros serviços populares na segunda-feira, 20 de outubro, devido a um problema no Sistema de Nomes de Domínio (DNS) da Amazon Web Services (AWS). A Amazon divulgou um relatório detalhado sobre os eventos que culminaram em uma interrupção de grande escala, afetando mais de 2.000 serviços e gerando mais de 16 milhões de relatórios de clientes individuais em 60 países que lutavam para acessar plataformas online.


O Epicentro da Falha e o "Defeito Latente"


O problema, conforme revelado pela Amazon, teve origem em seu maior cluster de data centers, o US-East-1. A empresa aponta que o evento foi "desencadeado por um defeito latente" em seu DNS do DynamoDB. Essencialmente, o sistema não conseguiu mais distribuir as informações cruciais necessárias para conectar os clientes aos serviços que dependem da infraestrutura AWS.


O DNS atua como a "lista telefônica" da internet, traduzindo nomes de sites para endereços IP e facilitando a troca de dados entre serviços e usuários. O bug inicial falhou em se auto-reparar, o que desencadeou uma reação em cadeia de problemas em outras partes da vasta plataforma AWS. Embora a interrupção tenha sido causada por uma falha interna, o incidente realça a fragilidade de ter uma concentração tão grande de serviços de internet de topo dependendo de um único fornecedor de cloud computing.


O Impacto Global e as Lições de Resiliência


A AWS informou que todos os serviços afetados retornaram às operações normais às 15h01 (horário do Pacífico) de segunda-feira, 20/10, reiterando que a causa foi "problemas de resolução de DNS" e prometendo um "resumo detalhado do evento pós-AWS". Contudo, as consequências financeiras do evento são significativas; analistas estimam que o custo total da interrupção pode chegar à casa dos bilhões de dólares.


O incidente rapidamente se tornou um ponto de discussão sobre a necessidade de descentralização. A Senadora Elizabeth Warren (D-Mass.) usou o evento para reforçar seu apelo pelo desmembramento de grandes empresas de tecnologia, declarando no X (anteriormente Twitter): "Se uma empresa pode quebrar a internet inteira, ela é grande demais. Ponto final. É hora de desmembrar a Big Tech."


Luke Kehoe, analista da indústria na Ookla, enfatiza que a resiliência é a principal lição. "Muitas organizações ainda concentram cargas de trabalho críticas em uma única região de cloud", disse Kehoe. Ele sugere que "distribuir aplicativos e dados cruciais por múltiplas regiões e zonas de disponibilidade pode reduzir materialmente o raio de explosão de incidentes futuros."


A Amazon pediu desculpas aos seus clientes, reconhecendo o quão críticos são seus serviços. "Sabemos que este evento impactou muitos clientes de maneiras significativas," afirmou a empresa, prometendo "fazer tudo o que pudermos para aprender com este evento e usá-lo para melhorar ainda mais nossa disponibilidade."


Via - PCmag

 
 
 

Parceiros

Inicie SuaCarreira em Cibersegurança de Elite.png
bottom of page