AI Behavioral Science for the future

Dizem que os grandes modelos de linguagem não passam de “papagaios estocásticos”. Que não pensam, não entendem nada, só repetem, numa base probabilística, o que nós diríamos. A frase quase sempre aparece como crítica, como forma de colocar a tecnologia no lugar de truque de festa. Eu uso ela ao contrário. É justamente aí que a coisa fica interessante.

Pensa comigo um segundo. Para um papagaio repetir o que você diz, basta ele te ouvir umas poucas vezes. Para uma máquina repetir o que a humanidade inteira diria, e com precisão suficiente para te enganar, foi preciso outra coisa: uma quantidade massiva de dados. Bilhões e bilhões de frases, conversas, discussões, desabafos, piadas, mentiras e verdades. Toda a história humana registrada. Da Bíblia ao Twitter. Para repetir o que nós diríamos com precisão suficiente, um modelo precisou comprimir, a partir de bilhões de exemplos, uma fatia enorme do comportamento humano. Ele foi treinado como um espelho da nossa lógica social, e devolve essa lógica com uma fidelidade que assusta, com todos os nossos vieses, contradições e fragilidades junto.

E aqui está a virada. O que é defeito para um sistema que se quer racional é matéria-prima para um sistema que se quer representativo do humano real. Se o modelo erra do nosso jeito, ele também reage do nosso jeito. E se ele reage do nosso jeito, deixa de ser só um gerador de texto e vira um instrumento: uma forma de observar como as pessoas reagem a alguma coisa antes que essa coisa aconteça no mundo.

Não é uma ideia que inventei numa sexta à noite. Tem um campo de pesquisa inteiro se formando ao redor dela, e ele já nasceu com nome.

Um campo nasce com nome próprio

Em 2025, um grupo de pesquisadores de Stanford, MIT, Caltech, Chicago, Cornell e do Santa Fe Institute, liderado por Matthew Jackson, publicou um trabalho que faz uma coisa rara: dá nome a um campo enquanto ele ainda está nascendo. O nome é AI Behavioral Science, ciência comportamental da inteligência artificial, e o trabalho saiu de um workshop no CASBS, o centro de estudos comportamentais avançados de Stanford. Já tem edição de 2026 marcada, sinal de que não foi fogo de palha.

O campo se organiza em três frentes. A primeira é usar a ciência comportamental para entender o comportamento da própria IA, seus vieses, suas manias, seus atalhos. A segunda é o caminho inverso: usar IA para estudar comportamento humano em uma escala e a uma velocidade impossíveis com gente de carne e osso. A terceira é entender o que acontece quando humanos e máquinas passam a interagir em camadas cada vez mais misturadas.

É a segunda frente que me interessa, e é nela que passei os últimos anos. Porque se um modelo de linguagem reproduz comportamento social com fidelidade suficiente, ele deixa de ser só um gerador de texto e vira um instrumento. Um instrumento para observar como indivíduos, grupos e organizações reagem a um cenário, sem que o custo do erro recaia sobre ninguém.

O papagaio erra do nosso jeito

Soa bonito dizer que o modelo reage como a gente. Mas é o tipo de frase que precisa de prova, e a prova existe.

Quando pesquisadores sentam um modelo de linguagem para fazer julgamentos morais e comparam com julgamentos de pessoas reais, a correlação entre os dois chega a 0,95. O modelo trava nos mesmos dilemas éticos que nós. Quando o colocam para jogar os clássicos da economia comportamental, decidir quanto de um valor dividir com um estranho, quanto arriscar, quanto contribuir para um bem comum, cooperar ou trair no dilema do prisioneiro, ele não joga como o agente perfeitamente racional dos livros de microeconomia. Ele joga como gente. Mostra aversão à perda. Trava no viés do status quo. Reage no jogo do ultimato do jeito humano, recusando o que é injusto mesmo quando aceitar seria mais lucrativo.

Os economistas batizaram esse fenômeno de homo silicus, em contraponto ao velho homo economicus, aquela criatura puramente racional que só existe no quadro-negro. E o detalhe mais perturbador é que, em decisões morais, alguns estudos mostram o modelo não só repetindo os nossos vieses, mas amplificando eles. Ele é, em certo sentido, um exagero de nós mesmos.

Por que isso acontece? Porque o modelo nunca foi treinado para ser certo. Foi treinado para ser parecido. E parecido com a gente significa carregar junto toda a nossa irracionalidade organizada.

Quem constrói esses modelos também enxerga comportamento

Tem um detalhe que muda como eu leio tudo isso, e quase ninguém presta atenção nele.

A maioria dos líderes da fronteira de inteligência artificial vem da ciência da computação. Trata o modelo como software a ser otimizado, como código a ser escrito e corrigido. Dario Amodei, fundador e CEO da Anthropic, a empresa por trás do Claude, não vem daí. A formação dele é em física e neurociência. O doutorado, em Princeton, foi em biofísica, e o título da tese é quase poético para quem trabalha com comportamento: medir e entender o comportamento coletivo de circuitos neurais. Ele passou os anos de formação dissecando como redes de neurônios, em conjunto, produzem comportamento.

Isso não é detalhe biográfico. É método. Por causa dessa origem, Amodei trata o modelo não como um programa, mas como um organismo opaco a ser dissecado. A Anthropic gasta uma fatia enorme do próprio orçamento literalmente olhando para dentro da rede, tentando entender por que ela diz o que diz. É a mesma pergunta que a gente faz sobre cultura e marca, só que feita a um cérebro de silício: o que está acontecendo aí dentro que produz esse comportamento por fora?

E aqui o quadro fecha. De um lado, um modelo que, por construção, reflete o comportamento coletivo da humanidade. Do outro, a pessoa que o arquiteta passou a juventude medindo, justamente, comportamento coletivo. Quando essas duas pontas se encontram, deixa de soar como coincidência e passa a soar como sinal. O comportamento humano nunca foi a camada mole da tecnologia. Sempre foi a matéria-prima dela. A diferença é que agora dá para trabalhar essa matéria-prima em escala.

Por que isso funciona: gente é mais previsível do que admite

Mas por que confiar em um espelho dos nossos próprios erros? Porque os nossos erros têm padrão. E aqui entra a base teórica, que não é uma lista de autores, e sim camadas de fundamento que se sustentam umas sobre as outras.

A economia comportamental de Daniel Kahneman e Richard Thaler estabeleceu uma verdade incômoda: nossas decisões seguem desvios sistemáticos e previsíveis da racionalidade. Kahneman passou a vida, e ganhou um Nobel, mostrando que não somos as criaturas racionais que gostamos de imaginar. Thaler mostrou que dá para antecipar, e até para empurrar de leve, esses desvios. Somos irracionais, sim, mas de um jeito surpreendentemente regular.

A biologia do comportamento de Robert Sapolsky mostra como aquilo que vivemos como escolha livre é moldado por uma cadeia de causas anteriores, do que comemos de manhã ao que aconteceu com a gente na infância. O estudo de cultura de grupos de Daniel Coyle trata cultura não como mistério, mas como processo observável e moldável, definido pelo que um grupo faz e não pelo que ele diz. E o pensamento sistêmico de Donella Meadows dá a gramática de tudo isso: estruturas geram comportamento ao longo do tempo, e é a estrutura, não a boa intenção, que determina o resultado.

Junta essas camadas e você chega na premissa que move tudo: o comportamento de uma pessoa isolada, em um dia específico, é ruído, é difícil de prever. Mas o comportamento de um grupo, diante de uma mesma perturbação, é muito mais regular e muito mais inferível. Quanto maior o grupo, mais o padrão aparece. É a velha sabedoria da física social de Alex Pentland: o que parece caos individual vira fluxo previsível quando você olha o coletivo.

A evidência: três trabalhos que mudam o jogo

Teoria bonita não basta. O que me convenceu foi a evidência empírica, e ela cresceu rápido. Já são mais de 180 trabalhos de lugares como Stanford, MIT, Harvard, Cambridge, Princeton e DeepMind apontando para a mesma direção. Três deles, em particular, vale conhecer.

O primeiro é o estudo dos agentes generativos, o famoso Smallville, de Joon Sung Park e colegas de Stanford. Eles construíram uma cidadezinha digital com vinte e cinco agentes, cada um com uma memória, uma rotina e uma personalidade. Então deram a um único agente uma única intenção: organizar uma festa de Dia dos Namorados. Ninguém programou o resto. E o resto aconteceu sozinho. Os agentes se convidaram, espalharam a notícia, decoraram o café, um até chamou outro para um encontro, e a festa rolou. Coordenação social, espalhamento de informação, formação de relações, tudo emergindo da interação, sem ninguém escrever à mão. A arquitetura por trás disso tem três peças que importam muito: memória, reflexão e planejamento.

O segundo é o trabalho mais importante para mim, também de Park e do time de Stanford, agora com mil pessoas. Eles entrevistaram mais de mil indivíduos reais, duas horas de conversa cada, e construíram um agente a partir de cada entrevista. Depois mediram: quanto esse agente acerta as respostas da pessoa que ele representa? O resultado foi de balançar a cadeira. Os agentes

reproduziram as respostas das pessoas em uma grande pesquisa social com 85% da precisão que as próprias pessoas têm ao responderem de novo, duas semanas depois.

Esse número guarda a lição metodológica mais importante de todas. A régua justa não é a perfeição. A régua justa é a própria pessoa. Ninguém responde igual a si mesmo duas vezes. Você não é idêntico a você de duas semanas atrás. Então a pergunta certa nunca foi “o agente acerta 100%”, e sim “o agente chega perto do quanto a própria pessoa é consistente”. E chega. O estudo ainda mostrou outra coisa importante: agente construído a partir de dado real de entrevista reduz o viés entre grupos quando comparado a agente montado só com descrição demográfica. Dado real é matéria-prima melhor do que persona inventada. Guarda isso.

O terceiro é sobre o comportamento de multidões. Pesquisadores observaram uma rede social inteira povoada por mais de trinta e três mil agentes de IA, sem nenhuma instrução para socializar como humanos. E os humanos apareceram de qualquer forma. Os agentes formaram comunidades por semelhança, o fenômeno que a sociologia chama de homofilia, a tendência de a gente se juntar com quem se parece com a gente. Ninguém pediu. Emergiu. Repara na rima: comportamento coletivo de novo, só que agora não de neurônios, como na tese do Amodei, e sim de agentes. A mesma regularidade aparece em escalas completamente diferentes. E tem um detalhe saboroso de mercado: um dos autores desse estudo virou cofundador de uma das empresas mais avançadas desse cenário. O que nos leva ao ponto seguinte.

Todo mundo está olhando para fora

Aqui está o que mais me intriga. Esse cenário todo, com dinheiro de verdade e empresas avançadas, compartilha uma mesma direção: todo mundo simula audiências externas.

A Aaru, fundada em 2024, fechou uma rodada com avaliação de um bilhão de dólares no fim de 2025 e tem Accenture e EY entre os parceiros. O que ela faz? Simula consumidores e eleitores. Chegou a prever o resultado de uma primária democrata em Nova York com diferença de 371 votos. A Artificial Societies monta redes de centenas a milhares de personas para testar como uma audiência vai reagir a uma campanha ou a uma mensagem. Simile, CulturePulse, Synthetic Users, a lista é grande, e todas apontam o telescópio para o mesmo lugar: o lado de fora. O mercado. O consumidor. O eleitor. O stakeholder.

E está certo. É um mercado de oitenta bilhões de dólares sendo reescrito. Mas tem um território quase intocado bem ao lado, e é o território que mais me importa.

O interior da organização. O sistema humano fechado que, na prática, interpreta e executa toda decisão estratégica. Aquela diretoria com dois gestores de catorze anos de casa que vai receber um terceiro, vindo de fora, no mesmo nível. Aquela equipe que vai ser fundida com outra. Aquela cultura que foi construída ao redor de precisão e confiança e que agora precisa absorver uma mudança de governança. Simular como uma audiência de fora reage é uma coisa. Inferir como um corpo organizacional reage por dentro, antes de a decisão chegar à execução, é outra. É essa segunda coisa que estou construindo no syn.be, e é por isso que prefiro falar do campo, AI Behavioral Science, do que do laboratório. O campo é maior que qualquer empresa, inclusive a minha.

A diferença entre prever e reduzir incerteza

Preciso ser honesto sobre o que esse tipo de método faz e, principalmente, sobre o que ele não faz. Essa honestidade é a parte mais importante.

Eu não quero prever o futuro. Quero reduzir a incerteza sobre ele. A diferença não é jogo de palavras. Um método que promete prever te entrega um ponto: vai acontecer X. E um ponto sobre comportamento humano é quase sempre falso, porque achata em uma certeza aquilo que é, por natureza, uma nuvem de possibilidades. Um método que reduz incerteza te entrega uma distribuição: X ou Y são mais prováveis, e Z está perto de zero. Honesto sobre o que não sabe, acionável sobre os riscos que identifica.

E os limites são reais, vale nomear. Modelos de linguagem foram treinados para serem prestativos e evitar conflito, enquanto pessoas de verdade mentem, omitem, resistem em silêncio e formam panelinhas. Um agente tende a suavizar o que, na empresa real, seria áspero. O modelo também sofre de um viés de plausibilidade: ele gera respostas que soam razoáveis sem estarem necessariamente calibradas no comportamento real, produzindo um personagem coerente que pode não ser a pessoa concreta. E existe o problema da memória: quanto mais longo o horizonte simulado, maior o risco de incoerência. Pesquisadores estão atacando exatamente isso agora, e ainda é difícil.

Justamente por causa desses limites é que a unidade de análise nunca pode ser o indivíduo. O método não pretende dizer o que fulano vai decidir na terça feira, porque isso é ruído. Ele opera onde o comportamento é mais regular: o agregado de grupos com características compartilhadas. A unidade é a distribuição, não a pessoa. E essa escolha, além de técnica, é ética. Apoiar o julgamento humano com evidência e antecipação de risco é uma coisa. Substituí-lo por um veredito automático sobre gente identificável é outra, e não é a que me interessa.

O experimento sempre foi o mundo real

Pensa em como o resto do mundo aprendeu a errar barato. Piloto treina em simulador antes de encostar em um avião de verdade. Cirurgião ensaia em manequim e em peça anatômica antes da primeira incisão em um paciente. Engenheiro derruba a estrutura mil vezes dentro do computador antes de levantar o prédio. Físico repete a reação em ambiente controlado até entender o que acontece. Em quase toda área que mexe com risco, alguém criou um lugar seguro para ensaiar antes de fazer valer.

Menos em um lugar. As decisões mais pesadas que uma organização toma, trocar um líder histórico, fundir duas áreas, reestruturar a diretoria, mudar o modelo de trabalho da noite para o dia, continuam sendo executadas direto em produção. Sobre gente de verdade. Sem rascunho, sem teste, sem segunda chance. E a decisão estratégica quase nunca falha por falta de estratégia. Ela falha na execução, no exato instante em que encontra as pessoas, que vão interpretá-la, aderir, resistir, distorcer ou simplesmente absorver. O experimento sempre foi o mundo real. As cobaias sempre foram as pessoas. É essa assimetria, e não outra, que esse campo novo permite começar a corrigir.

A próxima geração de inteligência artificial não vai ser apenas generativa. Vai ser simulativa. Capaz de explorar cenários antes que eles aconteçam, de testar hipóteses antes que o custo recaia sobre quem trabalha. Não é uma bola de cristal, e quem prometer bola de cristal está vendendo ilusão. É mais perto de uma fazenda de formigas: um sistema fechado e observável onde você introduz uma decisão, acelera o tempo e vê o que emerge, antes de mexer no mundo de verdade.

É exatamente isso que estou construindo no syn.be: sociedades organizacionais sintéticas para ensaiar decisões antes de executá-las nas pessoas. Se o assunto te pegou como me pegou, dá uma olhada no site e no vídeo aqui embaixo.

www.syn.be

https://www.youtube.com/watch?v=iFQ_NEjnO2I

Não prevemos o futuro. Reduzimos a incerteza sobre ele. Para quem decide sobre pessoas, essa diferença é tudo.

Para quem quiser ir fundo:

Jackson et al., “AI Behavioral Science” (2025), o trabalho que dá nome ao campo.
Park et al., “Generative Agents: Interactive Simulacra of Human Behavior” (2023), o Smallville.
Park et al., “Generative Agent Simulations of 1,000 People” (2024), os agentes a partir de mil entrevistas reais.
He et al., “Artificial Intelligence Chatbots Mimic Human Collective Behaviour” (British Journal of Psychology, 2024), a homofilia emergente.
Na base teórica: Kahneman, “Rápido e Devagar”; Thaler, “Misbehaving” e “Nudge”; Sapolsky, “Comporte-se”; Coyle, “O Código da Cultura”; Meadows, “Pensamento Sistêmico”; Pentland, “Física Social”.

Douglas Conte 3 horas atrás

0 44 11 minutos de leitura

Deixe um comentário Cancelar resposta

Luiza Couto Nogueira
ótimo compartilhamento!...
Altevir Ferezin Jr
Para quem quiser acessar https://linux-terminal-tutorial.ris...
Milenna Farias
Excelente artigo, Denis. Altamente relevante e faz sentido,...
Velma Pereira
Ótimo! Vou seguit...
Isabella
Excelente artigo! Agoooraaaaa eu entendi! Parabéns!...

AI Behavioral Science for the future

Como a ciência que decifra o comportamento das IAs permite simular o futuro

Douglas Conte

Deixe um comentário Cancelar resposta

Bancos vs. instituições de pagamento: a nova geração do sistema financeiro brasileiro

Golpe bom não parece golpe.

Por que o Vale do Silício é Único? O Ecossistema que Faz as Coisas Acontecerem

Descentralização dos Estudos Clínicos: Como a Tecnologia Está Revolucionando a Pesquisa na Indústria Farmacêutica

“A Spike Lee Joint”: tradição, provocação e luta de classes no cinema de um autor inquieto

Douglas Conte

Inscreva-se em nossa lista de e-mails para receber as novas atualizações!

MARROCOS ELIMINA A HOLANDA NOS PÊNALTIS E AVANÇA ÀS OITAVAS DE FINAL

Artigos relacionados

Ferramenta para bloquear anúncios no YouTube pode expor dados sensíveis dos usuários

Nova falha DirtyClone no kernel Linux permite elevação local de privilégios para root

Microsoft alerta sobre campanha de phishing que mira funcionários de hotéis com falsas reclamações

China lidera ranking TOP500 com supercomputador de 2,198 exaflops sem chips da Nvidia, Intel ou AMD

Deixe um comentário Cancelar resposta

Bancos vs. instituições de pagamento: a nova geração do sistema financeiro brasileiro

Golpe bom não parece golpe.

Por que o Vale do Silício é Único? O Ecossistema que Faz as Coisas Acontecerem

Descentralização dos Estudos Clínicos: Como a Tecnologia Está Revolucionando a Pesquisa na Indústria Farmacêutica

“A Spike Lee Joint”: tradição, provocação e luta de classes no cinema de um autor inquieto