
A rápida adoção de ferramentas de inteligência artificial (IA) tem colocado pressão sobre um dos recursos mais críticos do setor: a capacidade computacional. Nos últimos meses, empresas vêm enfrentando limitações na oferta de processamento, o que já impacta produtos, usuários e a estabilidade dos serviços.
De acordo com informações publicadas pelo jornal The Wall Street Journal, o problema surge em meio à expansão acelerada de soluções baseadas em IA — especialmente as chamadas ferramentas “agentic”, capazes de executar tarefas de forma autônoma. Com o aumento do uso dessas tecnologias para ganho de produtividade, a demanda por infraestrutura cresceu mais rápido do que a capacidade de resposta das empresas.
A escassez de capacidade já traz consequências práticas. Algumas empresas passaram a restringir o uso de seus serviços, enfrentam falhas operacionais e, em casos mais extremos, chegaram a cancelar projetos. Usuários também relatam dificuldades de acesso e limites de uso sendo atingidos com maior frequência.
Um dos principais gargalos está nos chamados tokens, que medem o consumo de processamento em tarefas de IA. Segundo especialistas do setor, esse recurso se tornou central à medida que a tecnologia evoluiu de aplicações simples para operações mais complexas e integradas.
Esse tipo de desequilíbrio entre oferta e demanda não é novo na indústria de tecnologia, mas ganha maior escala com o avanço acelerado da IA.
Além da limitação técnica, o cenário também pressiona os custos. O aluguel de GPUs — chips essenciais para treinar e operar modelos de IA — registrou forte alta desde o segundo semestre do ano passado. Modelos mais avançados lideram esse aumento, refletindo a crescente disputa por capacidade.
Um exemplo é a elevação no custo por hora de chips da linha Blackwell, da Nvidia, que passou de US$ 2,75 para US$ 4,08 em cerca de dois meses, um salto de 48%. Empresas como a CoreWeave também reajustaram preços em mais de 20% e passaram a exigir contratos mais longos, especialmente de clientes de menor porte.
A expansão da infraestrutura enfrenta obstáculos adicionais. A construção de novos data centers e a garantia de fornecimento de energia exigem tempo e investimentos elevados. Executivos do setor afirmam que a disponibilidade energética já está comprometida até 2026, o que limita ainda mais a capacidade de expansão.
Os efeitos dessa escassez já são percebidos na operação de serviços. Empresas como a Anthropic, responsável pelo chatbot Claude, registraram instabilidades frequentes e passaram a impor limites de uso em horários de pico, o que gerou insatisfação entre usuários.
Dados recentes mostram que a disponibilidade da API da empresa ficou em 98,95% nos últimos 90 dias — abaixo do padrão considerado ideal para serviços críticos, que normalmente operam próximos de 99,99%.
Diante desse cenário, empresas também vêm ajustando suas estratégias. A OpenAI, por exemplo, teria pausado o desenvolvimento de projetos como o gerador de vídeo Sora para redirecionar recursos computacionais a soluções corporativas e de programação.
O crescimento da demanda ajuda a explicar essa mudança: o uso da API da OpenAI saltou de 6 bilhões para 15 bilhões de tokens por minuto entre outubro e março, evidenciando a pressão sobre a infraestrutura.
Executivos reconhecem o desafio. A diretora financeira da OpenAI, Sarah Friar, afirmou que a empresa tem sido obrigada a priorizar projetos diante da limitação de capacidade disponível.
Apesar das dificuldades, o setor continua em expansão acelerada. A Anthropic, por exemplo, viu sua projeção de receita anual crescer de US$ 9 bilhões no fim de 2025 para US$ 30 bilhões poucos meses depois.
Esse crescimento intensifica ainda mais a pressão sobre a infraestrutura global, consolidando um cenário em que a demanda por poder computacional segue avançando rapidamente — enquanto a oferta evolui em ritmo mais lento.



