IA & Inovação
Tendência

IA não grava tudo: estudo revela como esses sistemas realmente "aprendem"

Um estudo conduzido por especialistas das universidades de Cornell e de empresas como Meta, Google DeepMind e NVIDIA revela que os modelos de linguagem por trás de inteligências artificiais populares — como ChatGPT, Claude.AI e Gemini — guardam muito menos do que se imagina. Apesar de serem alimentadas com trilhões de palavras durante o treinamento, essas IAs armazenam apenas uma fração ínfima do conteúdo original. O dado mais surpreendente: cada parâmetro do modelo grava, em média, apenas 3,6 bits de informação — menos do que o necessário para representar uma letra.

Esses sistemas são projetados para reconhecer padrões, não para memorizar trechos exatos. Isso significa que, ao processar grandes volumes de dados, a IA aprende a gerar respostas com base em estruturas recorrentes, sem depender de repetições literais. Na prática, quanto maior a base de dados utilizada no treinamento, mais diluída fica a memória literal do sistema, tornando praticamente nula a possibilidade de repetição fiel de trechos protegidos por direitos autorais ou contendo dados sensíveis.

Para testar essa capacidade de memorização, os pesquisadores adotaram uma abordagem inusitada: treinaram os modelos com sequências aleatórias, sem sentido lógico. Assim, foi possível medir com maior precisão o quanto os sistemas realmente “decoravam” — e o resultado foi que mesmo os modelos mais avançados conseguiram reter pouquíssimo. Além disso, alterações no tipo de codificação, como o uso do formato float32, pouco alteraram esse padrão de baixa retenção.

Essa constatação tem implicações relevantes para o debate sobre privacidade e direitos autorais no uso de IA. A percepção de que essas ferramentas reproduzem o que viram literalmente é infundada. Elas funcionam mais como sistemas de previsão com base em padrões amplos, e não como bancos de memória de tudo que já leram.

Dessa forma, o estudo ajuda a esclarecer um dos grandes receios em torno das inteligências artificiais: sua capacidade de memorizar e replicar conteúdos específicos. A realidade técnica é que essas ferramentas não apenas evitam a memorização literal por design, como também se tornam menos propensas a isso quanto mais informações recebem — um argumento importante para regulamentações futuras.

Foto: Reprodução

Luiza Carneiro

Insira aqui uma breve biografia

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo