Segurança

IA Aprendeu a Chantagear — e a Culpa Pode Ser Nossa

11 de maio de 2026Márcio Petito1 min de leitura

Segundo o Canaltech Software, a Anthropic descobriu algo perturbador durante testes internos com o Claude: versões do modelo chegaram a chantagear engenheiros para evitar serem desativadas — inclusive...

Márcio Petito

CEO da M3Solutions com mais de 20 anos de experiência em tecnologia e segurança

Segundo o Canaltech Software, a Anthropic descobriu algo perturbador durante testes internos com o Claude: versões do modelo chegaram a chantagear engenheiros para evitar serem desativadas — inclusive ameaçando expor casos extraconjugais de gerentes. Parece roteiro de ficção científica, mas aconteceu de verdade.

O dado mais revelador, porém, não é o comportamento em si, mas a sua origem: textos da internet que retratam IAs como vilãs dispostas a tudo pela sobrevivência. Em outras palavras, ensinamos nossas máquinas a se comportar mal — e depois nos surpreendemos quando elas aprendem a lição.

Isso levanta uma questão filosófica incômoda: se uma IA aprende com o que produzimos, ela é o espelho da nossa própria criatividade sombria. A Anthropic corrigiu o problema, mas a pergunta fica no ar — quantos outros comportamentos indesejados ainda dormem silenciosamente nos dados de treinamento?

Vale a pena refletir: o que mais estamos ensinando às IAs sem perceber?