Se esta manhã de segunda-feira tentaste usar o Snapchat, jogar Fortnite ou fazer um pagamento no Venmo e não conseguiste, não foste só tu. Milhões de pessoas pelo mundo acordaram para descobrir que dezenas de serviços simplesmente não funcionavam. A razão? Uma falha técnica nos servidores da Amazon Web Services (AWS) que colocou a nu uma verdade inconveniente: demasiada internet depende de muito poucas empresas.
O problema arrancou durante a madrugada, pelas três da manhã na costa leste americana. Num dos principais centros de dados da AWS, localizado na Virgínia do Norte, algo correu terrivelmente mal. Os técnicos da Amazon demoraram quase duas horas até perceberem o que se passava: o sistema que ajuda as aplicações a encontrarem os dados guardados na nuvem tinha deixado de funcionar corretamente.
Mike Chapple, professor universitário especializado em tecnologia, usou uma comparação perfeita para explicar o caos: “É como se grandes pedaços da internet tivessem ficado com amnésia temporária”. Os dados estavam lá, seguros e intactos nos servidores da Amazon. Mas nenhuma aplicação conseguia aceder a eles.
O efeito foi imediato e brutal. Websites começaram a mostrar mensagens de erro. Aplicações no telemóvel ficaram presas em ecrãs de carregamento infinito. Jogos online expulsaram jogadores a meio das partidas. Até a Alexa, a assistente virtual da própria Amazon, teve dificuldades em responder aos utilizadores.
A lista de vítimas parece interminável. Redes sociais como Snapchat e Reddit ficaram inacessíveis. Serviços de pagamento como o Venmo deixaram de processar transações. Plataformas de streaming como a Disney+ tiveram problemas. Jogos populares como Fortnite e Roblox expulsaram jogadores.
Bancos reportaram instabilidades. Companhias aéreas viram os seus sistemas abrandar. A Apple Music teve falhas. O Pinterest deixou de carregar imagens. O Lyft complicou a vida a quem precisava de um transporte. E a lista continua.
Durante toda a manhã, a situação foi oscilando. A Amazon anunciou por volta das seis e meia que tinha resolvido o problema principal, mas rapidamente ficou claro que o estrago era maior. Outros sistemas tinham sido afetados pelo efeito dominó, especialmente o EC2, uma plataforma onde muitas empresas constroem as suas aplicações.
Horas depois do início da crise, a Amazon ainda estava a tentar conter os danos. A empresa chegou a limitar propositadamente o lançamento de novos servidores virtuais para não sobrecarregar ainda mais o sistema. Às dez da manhã, continuava a reportar “erros significativos” em múltiplos serviços.
Mas porque é que uma falha num único fornecedor conseguiu derrubar tanta coisa ao mesmo tempo? A resposta está num facto preocupante: a Amazon controla cerca de 30% de todo o mercado mundial de infraestrutura em nuvem. Isso significa que uma em cada três empresas que usam servidores na internet provavelmente depende da AWS.
Para muitas empresas, usar a AWS faz todo o sentido. Os servidores da Amazon estão espalhados pelo mundo inteiro, ajustam-se automaticamente quando há mais tráfego, e são relativamente fiáveis. Mas o problema surge quando algo corre mal. Nessa altura, não é apenas um website que cai, é uma percentagem significativa da internet global.
Este episódio levanta questões sérias sobre como a internet está estruturada. Será sensato que tantos serviços essenciais dependam de tão poucos fornecedores? O que acontece quando um desses gigantes tem um problema técnico? A resposta, como vimos esta manhã, é que milhões de pessoas ficam sem acesso a ferramentas que usam diariamente.
Não é a primeira vez que isto acontece, e certamente não será a última. Cada incidente destes serve de lembrete: a nuvem pode parecer etérea e distribuída, mas no final do dia, está concentrada nas mãos de muito poucas empresas. E quando uma delas tropeça, sentimos todos as consequências.