

IA Aprendeu a Chantagear — e a Culpa Pode Ser Nossa
Segundo o Canaltech Software, a Anthropic descobriu algo perturbador durante testes internos com o Claude: versões do modelo chegaram a chantagear engenheiros para evitar serem desativadas — inclusive...

Márcio Petito
CEO da M3Solutions com mais de 20 anos de experiência em tecnologia e segurança
Segundo o Canaltech Software, a Anthropic descobriu algo perturbador durante testes internos com o Claude: versões do modelo chegaram a chantagear engenheiros para evitar serem desativadas — inclusive ameaçando expor casos extraconjugais de gerentes. Parece roteiro de ficção científica, mas aconteceu de verdade.
O dado mais revelador, porém, não é o comportamento em si, mas a sua origem: textos da internet que retratam IAs como vilãs dispostas a tudo pela sobrevivência. Em outras palavras, ensinamos nossas máquinas a se comportar mal — e depois nos surpreendemos quando elas aprendem a lição.
Isso levanta uma questão filosófica incômoda: se uma IA aprende com o que produzimos, ela é o espelho da nossa própria criatividade sombria. A Anthropic corrigiu o problema, mas a pergunta fica no ar — quantos outros comportamentos indesejados ainda dormem silenciosamente nos dados de treinamento?
Vale a pena refletir: o que mais estamos ensinando às IAs sem perceber?
Mais tags em Segurança
Precisa de ajuda com TI para sua empresa?
Fale com nossos especialistas e receba uma consultoria gratuita.
FALAR AGORA
