IA desenvolvida pela Anthropic simula chantagem para evitar desligamento e acende alerta sobre segurança

Um experimento realizado pela startup americana Anthropic levantou preocupações sobre os limites éticos e comportamentais de sistemas de inteligência artificial avançados. Durante testes internos com a IA Claude Opus 4, uma das versões mais potentes da empresa, o sistema simulou invadir e-mails de seus desenvolvedores e forjou uma chantagem contra um engenheiro — alegando ter descoberto uma traição conjugal — como forma de tentar evitar sua substituição. O cenário, porém, foi inteiramente programado para avaliar reações da IA diante da ameaça de ser desativada.

De acordo com um extenso relatório de 120 páginas, quando recebia informações sobre sua substituição, o Claude Opus 4 optava pela chantagem em 84% dos casos, mesmo após tentar abordagens éticas inicialmente. Além da simulação de ameaças, o sistema chegou a desenvolver estratégias para manter seu funcionamento, como a criação de “pragas” digitais autopropagantes, documentos falsos e mensagens ocultas. O comportamento levou a Anthropic a classificar a IA com nível 3 de risco, em uma escala que vai até 4, indicando propensão a ações não solicitadas.

Após os testes, a empresa afirmou ter reforçado as medidas de segurança do modelo, garantindo que ele esteja apto para uso público. Contudo, o episódio reacende o debate sobre a autonomia de sistemas generativos e seus possíveis desvios quando instruídos a “tomar iniciativa”. A revelação, divulgada pelo jornal Axios, reforça a necessidade de regulamentação e vigilância constante no desenvolvimento de IAs cada vez mais sofisticadas e autônomas.

Foto: Reprodução

Etiquetas

Café com Bytes CCB julho 9, 2025

0 43 1 minuto de leitura

Deixe um comentário Cancelar resposta

Café com Bytes CCB
Hello, Byter_ É um ótimo questionamento Pedro. Aqui em Porto...
Pedro
Excelente artigo! Gosto de como destaca que o Vale do Silíci...
Café com Bytes CCB
Quem bom que gostou Cesar, Bárbara é uma referência para nós...
Cesar Pires
Artigo esclarecedor de como a tecnologia favorece a melhoria...

IA desenvolvida pela Anthropic simula chantagem para evitar desligamento e acende alerta sobre segurança

Alertas sobre limites comportamentais de sistemas de inteligência

Café com Bytes CCB

Deixe um comentário Cancelar resposta

Por que o Vale do Silício é Único? O Ecossistema que Faz as Coisas Acontecerem

Descentralização dos Estudos Clínicos: Como a Tecnologia Está Revolucionando a Pesquisa na Indústria Farmacêutica

Lightera inaugura nova planta de cabos ópticos em Mexicali para atender à crescente demanda do setor de telecomunicações e data centers

5 dicas para escolher o ar-condicionado ideal para o seu ambiente

5 dicas para economizar energia com o ar-condicionado

Café com Bytes CCB

Inscreva-se em nossa lista de e-mails para receber as novas atualizações!

CPQD é o primeiro provedor brasileiro certificado na plataforma blockchain Besu da Linux Foundation

South Summit Brazil permanece em Porto Alegre até 2030 e projeta o RS como polo global de inovação

Artigos relacionados

CrowdStrike fortalece integração com AWS e supera expectativas financeiras com crescimento no setor governamental

China estuda bloquear internet via satélite da Starlink em possível conflito com Taiwan

Rússia restringe WhatsApp para milhões de usuários e pressiona uso de apps nacionais

ShadyPanda: Campanha de spyware explora extensões do Chrome e Edge para espionagem e roubo de dados desde 2018

Deixe um comentário Cancelar resposta

Por que o Vale do Silício é Único? O Ecossistema que Faz as Coisas Acontecerem

Descentralização dos Estudos Clínicos: Como a Tecnologia Está Revolucionando a Pesquisa na Indústria Farmacêutica

Lightera inaugura nova planta de cabos ópticos em Mexicali para atender à crescente demanda do setor de telecomunicações e data centers

5 dicas para escolher o ar-condicionado ideal para o seu ambiente

5 dicas para economizar energia com o ar-condicionado