Explosão de usuários põe à prova servidores e modelos de linguagem globais
ChatGPT, Claude e DeepSeek enfrentam instabilidades desde março, apesar de exibirem uptime de 99%. A onda de quedas expõe o quanto a demanda crescente pressiona GPUs, redes e balanceadores de carga que sustentam a IA generativa.
- Em resumo: Mesmo “no ar”, os chatbots falham por sobrecarga, picos regionais e dependência de provedores como Cloudflare.
Quando “o serviço caiu” não quer dizer 0% de disponibilidade
Muitos usuários relatam lentidão, respostas vazias ou telas de erro. Esse sintoma parcial, explica o especialista Joab Júnior, ocorre porque a falha pode afetar só determinados recursos ou regiões. Casos semelhantes foram documentados pela Wired, que aponta que a percepção de pane cresce proporcionalmente à base global de usuários.
“Se a resposta demora ou precisa ser reenviada, a sensação é de queda, mesmo que tecnicamente o serviço permaneça ativo”, destaca Joab Júnior, da Vericode.
Infraestrutura sob estresse: GPUs lotadas e rotas congestionadas
A IA generativa exige enormes clusters de GPUs, conexões InfiniBand e sistemas de cache de baixa latência. Com janelas de contexto cada vez maiores e picos de acessos simultâneos, esses recursos operam no limite. Um congestionamento na malha ou em provedores de DNS, como o incidente global da Cloudflare em 2025, é suficiente para derrubar parcialmente qualquer chatbot.
Empresas tentam mitigar o risco com autoscaling, replicação multi-região e acordos de Service Level Objective (SLO) de 99,9%. Mesmo assim, cada minuto de falha revela quanto ainda falta otimizar a camada de orquestração que distribui requisições de modelos de bilhões de parâmetros.
O que você acha? As big techs deveriam investir em modos offline ou diversificar nuvens para evitar novas panes? Para acompanhar mais análises, acesse nossa editoria de Inteligência Artificial.
Crédito da imagem: Divulgação / OpenAI