ColunistasNews
Tendência

AI Behavioral Science for the future

Como a ciência que decifra o comportamento das IAs permite simular o futuro

Dizem que os grandes modelos de linguagem não passam de “papagaios  estocásticos”. Que não pensam, não entendem nada, só repetem, numa base  probabilística, o que nós diríamos. A frase quase sempre aparece como crítica,  como forma de colocar a tecnologia no lugar de truque de festa. Eu uso ela ao  contrário. É justamente aí que a coisa fica interessante. 

Pensa comigo um segundo. Para um papagaio repetir o que você diz, basta ele  te ouvir umas poucas vezes. Para uma máquina repetir o que a humanidade  inteira diria, e com precisão suficiente para te enganar, foi preciso outra coisa:  uma quantidade massiva de dados. Bilhões e bilhões de frases, conversas,  discussões, desabafos, piadas, mentiras e verdades. Toda a história humana  registrada. Da Bíblia ao Twitter. Para repetir o que nós diríamos com precisão  suficiente, um modelo precisou comprimir, a partir de bilhões de exemplos,  uma fatia enorme do comportamento humano. Ele foi treinado como um  espelho da nossa lógica social, e devolve essa lógica com uma fidelidade que  assusta, com todos os nossos vieses, contradições e fragilidades junto. 

E aqui está a virada. O que é defeito para um sistema que se quer racional é  matéria-prima para um sistema que se quer representativo do humano real. Se  o modelo erra do nosso jeito, ele também reage do nosso jeito. E se ele reage  do nosso jeito, deixa de ser só um gerador de texto e vira um instrumento: uma forma de observar como as pessoas reagem a alguma coisa antes que essa  coisa aconteça no mundo. 

Não é uma ideia que inventei numa sexta à noite. Tem um campo de pesquisa  inteiro se formando ao redor dela, e ele já nasceu com nome. 

Um campo nasce com nome próprio 

Em 2025, um grupo de pesquisadores de Stanford, MIT, Caltech, Chicago,  Cornell e do Santa Fe Institute, liderado por Matthew Jackson, publicou um  trabalho que faz uma coisa rara: dá nome a um campo enquanto ele ainda está  nascendo. O nome é AI Behavioral Science, ciência comportamental da  inteligência artificial, e o trabalho saiu de um workshop no CASBS, o centro de  estudos comportamentais avançados de Stanford. Já tem edição de 2026  marcada, sinal de que não foi fogo de palha. 

O campo se organiza em três frentes. A primeira é usar a ciência  comportamental para entender o comportamento da própria IA, seus vieses,  suas manias, seus atalhos. A segunda é o caminho inverso: usar IA para  estudar comportamento humano em uma escala e a uma velocidade  impossíveis com gente de carne e osso. A terceira é entender o que acontece  quando humanos e máquinas passam a interagir em camadas cada vez mais  misturadas. 

É a segunda frente que me interessa, e é nela que passei os últimos anos.  Porque se um modelo de linguagem reproduz comportamento social com  fidelidade suficiente, ele deixa de ser só um gerador de texto e vira um  instrumento. Um instrumento para observar como indivíduos, grupos e  organizações reagem a um cenário, sem que o custo do erro recaia sobre  ninguém. 

O papagaio erra do nosso jeito 

Soa bonito dizer que o modelo reage como a gente. Mas é o tipo de frase que  precisa de prova, e a prova existe. 

Quando pesquisadores sentam um modelo de linguagem para fazer  julgamentos morais e comparam com julgamentos de pessoas reais, a  correlação entre os dois chega a 0,95. O modelo trava nos mesmos dilemas  éticos que nós. Quando o colocam para jogar os clássicos da economia  comportamental, decidir quanto de um valor dividir com um estranho, quanto  arriscar, quanto contribuir para um bem comum, cooperar ou trair no dilema do  prisioneiro, ele não joga como o agente perfeitamente racional dos livros de  microeconomia. Ele joga como gente. Mostra aversão à perda. Trava no viés do  status quo. Reage no jogo do ultimato do jeito humano, recusando o que é  injusto mesmo quando aceitar seria mais lucrativo.

Os economistas batizaram esse fenômeno de homo silicus, em contraponto ao  velho homo economicus, aquela criatura puramente racional que só existe no  quadro-negro. E o detalhe mais perturbador é que, em decisões morais, alguns  estudos mostram o modelo não só repetindo os nossos vieses, mas  amplificando eles. Ele é, em certo sentido, um exagero de nós mesmos. 

Por que isso acontece? Porque o modelo nunca foi treinado para ser certo. Foi  treinado para ser parecido. E parecido com a gente significa carregar junto  toda a nossa irracionalidade organizada. 

Quem constrói esses modelos também enxerga comportamento 

Tem um detalhe que muda como eu leio tudo isso, e quase ninguém presta  atenção nele. 

A maioria dos líderes da fronteira de inteligência artificial vem da ciência da  computação. Trata o modelo como software a ser otimizado, como código a ser  escrito e corrigido. Dario Amodei, fundador e CEO da Anthropic, a empresa por  trás do Claude, não vem daí. A formação dele é em física e neurociência. O  doutorado, em Princeton, foi em biofísica, e o título da tese é quase poético  para quem trabalha com comportamento: medir e entender o comportamento  coletivo de circuitos neurais. Ele passou os anos de formação dissecando como  redes de neurônios, em conjunto, produzem comportamento. 

Isso não é detalhe biográfico. É método. Por causa dessa origem, Amodei trata  o modelo não como um programa, mas como um organismo opaco a ser  dissecado. A Anthropic gasta uma fatia enorme do próprio orçamento  literalmente olhando para dentro da rede, tentando entender por que ela diz o  que diz. É a mesma pergunta que a gente faz sobre cultura e marca, só que  feita a um cérebro de silício: o que está acontecendo aí dentro que produz esse  comportamento por fora? 

E aqui o quadro fecha. De um lado, um modelo que, por construção, reflete o  comportamento coletivo da humanidade. Do outro, a pessoa que o arquiteta  passou a juventude medindo, justamente, comportamento coletivo. Quando  essas duas pontas se encontram, deixa de soar como coincidência e passa a  soar como sinal. O comportamento humano nunca foi a camada mole da  tecnologia. Sempre foi a matéria-prima dela. A diferença é que agora dá para  trabalhar essa matéria-prima em escala. 

Por que isso funciona: gente é mais previsível do que admite 

Mas por que confiar em um espelho dos nossos próprios erros? Porque os  nossos erros têm padrão. E aqui entra a base teórica, que não é uma lista de  autores, e sim camadas de fundamento que se sustentam umas sobre as  outras.

A economia comportamental de Daniel Kahneman e Richard Thaler estabeleceu  uma verdade incômoda: nossas decisões seguem desvios sistemáticos e  previsíveis da racionalidade. Kahneman passou a vida, e ganhou um Nobel,  mostrando que não somos as criaturas racionais que gostamos de imaginar.  Thaler mostrou que dá para antecipar, e até para empurrar de leve, esses  desvios. Somos irracionais, sim, mas de um jeito surpreendentemente regular. 

A biologia do comportamento de Robert Sapolsky mostra como aquilo que  vivemos como escolha livre é moldado por uma cadeia de causas anteriores, do  que comemos de manhã ao que aconteceu com a gente na infância. O estudo  de cultura de grupos de Daniel Coyle trata cultura não como mistério, mas  como processo observável e moldável, definido pelo que um grupo faz e não  pelo que ele diz. E o pensamento sistêmico de Donella Meadows dá a  gramática de tudo isso: estruturas geram comportamento ao longo do tempo, e  é a estrutura, não a boa intenção, que determina o resultado. 

Junta essas camadas e você chega na premissa que move tudo: o  comportamento de uma pessoa isolada, em um dia específico, é ruído, é difícil  de prever. Mas o comportamento de um grupo, diante de uma mesma  perturbação, é muito mais regular e muito mais inferível. Quanto maior o grupo,  mais o padrão aparece. É a velha sabedoria da física social de Alex Pentland: o  que parece caos individual vira fluxo previsível quando você olha o coletivo. 

A evidência: três trabalhos que mudam o jogo 

Teoria bonita não basta. O que me convenceu foi a evidência empírica, e ela  cresceu rápido. Já são mais de 180 trabalhos de lugares como Stanford, MIT,  Harvard, Cambridge, Princeton e DeepMind apontando para a mesma direção.  Três deles, em particular, vale conhecer. 

O primeiro é o estudo dos agentes generativos, o famoso Smallville, de Joon  Sung Park e colegas de Stanford. Eles construíram uma cidadezinha digital com  vinte e cinco agentes, cada um com uma memória, uma rotina e uma  personalidade. Então deram a um único agente uma única intenção: organizar  uma festa de Dia dos Namorados. Ninguém programou o resto. E o resto  aconteceu sozinho. Os agentes se convidaram, espalharam a notícia,  decoraram o café, um até chamou outro para um encontro, e a festa rolou.  Coordenação social, espalhamento de informação, formação de relações, tudo  emergindo da interação, sem ninguém escrever à mão. A arquitetura por trás  disso tem três peças que importam muito: memória, reflexão e planejamento. 

O segundo é o trabalho mais importante para mim, também de Park e do time  de Stanford, agora com mil pessoas. Eles entrevistaram mais de mil indivíduos  reais, duas horas de conversa cada, e construíram um agente a partir de cada  entrevista. Depois mediram: quanto esse agente acerta as respostas da pessoa  que ele representa? O resultado foi de balançar a cadeira. Os agentes 

reproduziram as respostas das pessoas em uma grande pesquisa social com  85% da precisão que as próprias pessoas têm ao responderem de novo, duas  semanas depois. 

Esse número guarda a lição metodológica mais importante de todas. A régua  justa não é a perfeição. A régua justa é a própria pessoa. Ninguém responde  igual a si mesmo duas vezes. Você não é idêntico a você de duas semanas  atrás. Então a pergunta certa nunca foi “o agente acerta 100%”, e sim “o agente  chega perto do quanto a própria pessoa é consistente”. E chega. O estudo  ainda mostrou outra coisa importante: agente construído a partir de dado real  de entrevista reduz o viés entre grupos quando comparado a agente montado  só com descrição demográfica. Dado real é matéria-prima melhor do que  persona inventada. Guarda isso. 

O terceiro é sobre o comportamento de multidões. Pesquisadores observaram  uma rede social inteira povoada por mais de trinta e três mil agentes de IA, sem  nenhuma instrução para socializar como humanos. E os humanos apareceram  de qualquer forma. Os agentes formaram comunidades por semelhança, o  fenômeno que a sociologia chama de homofilia, a tendência de a gente se  juntar com quem se parece com a gente. Ninguém pediu. Emergiu. Repara na  rima: comportamento coletivo de novo, só que agora não de neurônios, como  na tese do Amodei, e sim de agentes. A mesma regularidade aparece em  escalas completamente diferentes. E tem um detalhe saboroso de mercado: um  dos autores desse estudo virou cofundador de uma das empresas mais  avançadas desse cenário. O que nos leva ao ponto seguinte. 

Todo mundo está olhando para fora 

Aqui está o que mais me intriga. Esse cenário todo, com dinheiro de verdade e  empresas avançadas, compartilha uma mesma direção: todo mundo simula  audiências externas. 

A Aaru, fundada em 2024, fechou uma rodada com avaliação de um bilhão de  dólares no fim de 2025 e tem Accenture e EY entre os parceiros. O que ela faz? Simula consumidores e eleitores. Chegou a prever o resultado de uma primária  democrata em Nova York com diferença de 371 votos. A Artificial Societies  monta redes de centenas a milhares de personas para testar como uma  audiência vai reagir a uma campanha ou a uma mensagem. Simile,  CulturePulse, Synthetic Users, a lista é grande, e todas apontam o telescópio  para o mesmo lugar: o lado de fora. O mercado. O consumidor. O eleitor. O  stakeholder. 

E está certo. É um mercado de oitenta bilhões de dólares sendo reescrito. Mas  tem um território quase intocado bem ao lado, e é o território que mais me  importa. 

O interior da organização. O sistema humano fechado que, na prática, interpreta e executa toda decisão estratégica. Aquela diretoria com dois  gestores de catorze anos de casa que vai receber um terceiro, vindo de fora, no  mesmo nível. Aquela equipe que vai ser fundida com outra. Aquela cultura que  foi construída ao redor de precisão e confiança e que agora precisa absorver  uma mudança de governança. Simular como uma audiência de fora reage é  uma coisa. Inferir como um corpo organizacional reage por dentro, antes de a  decisão chegar à execução, é outra. É essa segunda coisa que estou  construindo no syn.be, e é por isso que prefiro falar do campo, AI Behavioral  Science, do que do laboratório. O campo é maior que qualquer empresa,  inclusive a minha. 

A diferença entre prever e reduzir incerteza 

Preciso ser honesto sobre o que esse tipo de método faz e, principalmente,  sobre o que ele não faz. Essa honestidade é a parte mais importante. 

Eu não quero prever o futuro. Quero reduzir a incerteza sobre ele. A diferença  não é jogo de palavras. Um método que promete prever te entrega um ponto:  vai acontecer X. E um ponto sobre comportamento humano é quase sempre  falso, porque achata em uma certeza aquilo que é, por natureza, uma nuvem de  possibilidades. Um método que reduz incerteza te entrega uma distribuição: X  ou Y são mais prováveis, e Z está perto de zero. Honesto sobre o que não sabe,  acionável sobre os riscos que identifica. 

E os limites são reais, vale nomear. Modelos de linguagem foram treinados para  serem prestativos e evitar conflito, enquanto pessoas de verdade mentem,  omitem, resistem em silêncio e formam panelinhas. Um agente tende a suavizar  o que, na empresa real, seria áspero. O modelo também sofre de um viés de  plausibilidade: ele gera respostas que soam razoáveis sem estarem  necessariamente calibradas no comportamento real, produzindo um  personagem coerente que pode não ser a pessoa concreta. E existe o problema  da memória: quanto mais longo o horizonte simulado, maior o risco de  incoerência. Pesquisadores estão atacando exatamente isso agora, e ainda é  difícil. 

Justamente por causa desses limites é que a unidade de análise nunca pode  ser o indivíduo. O método não pretende dizer o que fulano vai decidir na terça feira, porque isso é ruído. Ele opera onde o comportamento é mais regular: o  agregado de grupos com características compartilhadas. A unidade é a  distribuição, não a pessoa. E essa escolha, além de técnica, é ética. Apoiar o  julgamento humano com evidência e antecipação de risco é uma coisa.  Substituí-lo por um veredito automático sobre gente identificável é outra, e não  é a que me interessa. 

O experimento sempre foi o mundo real 

Pensa em como o resto do mundo aprendeu a errar barato. Piloto treina em simulador antes de encostar em um avião de verdade. Cirurgião ensaia em  manequim e em peça anatômica antes da primeira incisão em um paciente.  Engenheiro derruba a estrutura mil vezes dentro do computador antes de  levantar o prédio. Físico repete a reação em ambiente controlado até entender  o que acontece. Em quase toda área que mexe com risco, alguém criou um  lugar seguro para ensaiar antes de fazer valer. 

Menos em um lugar. As decisões mais pesadas que uma organização toma,  trocar um líder histórico, fundir duas áreas, reestruturar a diretoria, mudar o  modelo de trabalho da noite para o dia, continuam sendo executadas direto em  produção. Sobre gente de verdade. Sem rascunho, sem teste, sem segunda  chance. E a decisão estratégica quase nunca falha por falta de estratégia. Ela  falha na execução, no exato instante em que encontra as pessoas, que vão  interpretá-la, aderir, resistir, distorcer ou simplesmente absorver. O  experimento sempre foi o mundo real. As cobaias sempre foram as pessoas. É  essa assimetria, e não outra, que esse campo novo permite começar a corrigir. 

A próxima geração de inteligência artificial não vai ser apenas generativa. Vai  ser simulativa. Capaz de explorar cenários antes que eles aconteçam, de testar  hipóteses antes que o custo recaia sobre quem trabalha. Não é uma bola de  cristal, e quem prometer bola de cristal está vendendo ilusão. É mais perto de  uma fazenda de formigas: um sistema fechado e observável onde você introduz  uma decisão, acelera o tempo e vê o que emerge, antes de mexer no mundo de  verdade. 

É exatamente isso que estou construindo no syn.be: sociedades  organizacionais sintéticas para ensaiar decisões antes de executá-las nas  pessoas. Se o assunto te pegou como me pegou, dá uma olhada no site e no  vídeo aqui embaixo. 

www.syn.be 

https://www.youtube.com/watch?v=iFQ_NEjnO2I 

Não prevemos o futuro. Reduzimos a incerteza sobre ele. Para quem decide  sobre pessoas, essa diferença é tudo. 

Para quem quiser ir fundo:

  • Jackson et al., “AI Behavioral Science” (2025), o trabalho que dá nome ao campo.
  • Park et al., “Generative Agents: Interactive Simulacra of Human Behavior” (2023), o Smallville.
  • Park et al., “Generative Agent Simulations of 1,000 People” (2024), os agentes a partir de mil entrevistas reais.
  • He et al., “Artificial Intelligence Chatbots Mimic Human Collective Behaviour” (British Journal of Psychology, 2024), a homofilia emergente.
  • Na base teórica: Kahneman, “Rápido e Devagar”; Thaler, “Misbehaving” e “Nudge”; Sapolsky, “Comporte-se”; Coyle, “O Código da Cultura”; Meadows, “Pensamento Sistêmico”; Pentland, “Física Social”.

Douglas Conte

CEO da Qore, humantech de mapeamento comportamental, e fundador do syn.be, laboratório que cria sociedades organizacionais sintéticas para simular cenários futuros. Trabalho na interseção entre ciência comportamental, branding, cultura e IA para decifrar padrões humanos invisíveis, transformar comportamento em dados e simular reações, antecipando dinâmicas e reduzindo incertezas sobre o futuro.

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo