Uma IA do Google resolveu problemas de matemática abertos há 56 anos por algumas centenas de dólares

Um sistema de pesquisa da Google DeepMind produziu demonstrações completas e verificadas por máquina para nove problemas em aberto propostos pelo matemático Paul Erdős, dois deles sem solução havia 56 anos. O mesmo sistema fechou 44 conjecturas tiradas da Enciclopédia On-line de Sequências de Inteiros, resolveu uma questão de geometria algébrica aberta havia 15 anos e ajustou um limite conhecido em otimização convexa. A contagem chamativa importa menos do que o método. Cada uma dessas demonstrações foi verificada por uma máquina, não apenas afirmada por ela.

Erdős, morto em 1996, deixou centenas de perguntas precisas e teimosas, muitas fáceis de enunciar e brutalmente difíceis de fechar. Ao longo de décadas viraram uma espécie de prova permanente para a área. As conjecturas de sequências vêm de um banco de dados público que os matemáticos vasculham em busca de padrões, onde uma fórmula intuída pode ficar sem prova por anos. Não são testes de laboratório feitos para agradar a um modelo. São o atraso real da matemática em aberto.

Essa distinção é a história inteira. O sistema, chamado AlphaProof Nexus, escreve seus argumentos em Lean, uma linguagem formal cujo compilador rejeita qualquer passo que não possa confirmar. Uma demonstração passa ou não passa, sem espaço para um parágrafo confiante que depois se mostra errado. Para quem tenta julgar se uma ‘descoberta’ de IA é real, essa é a fronteira entre um comunicado de imprensa e um resultado.

Por baixo, o provador roda sobre o Gemini 3.1 Pro, com um modelo mais leve cuidando das tarefas de classificação. O ciclo é quase entediante. O modelo redige uma prova em Lean, o compilador devolve os erros e esses erros alimentam a tentativa seguinte. O que mantém a honestidade é o retorno simbólico, não a prosa fluente. A equipe construiu quatro versões de complexidade crescente, uma delas capaz de gerar e ordenar esboços de demonstração rivais. Ainda assim, a versão mais simples, um mero ciclo de modelo e compilador, resolveu sozinha os nove problemas de Erdős.

A economia é a parte silenciosamente surpreendente. Cada problema resolvido custou algumas centenas de dólares em tempo de computação. Perguntas que consumiram carreiras inteiras foram fechadas por mais ou menos o preço de uma viagem de fim de semana. Isso não aposenta o matemático. Alguém ainda precisa escolher quais problemas vale a pena atacar, formulá-los de um jeito que o sistema consiga ler e decidir o que significa uma resposta. O que muda é a aritmética do que vale a pena tentar.

As ressalvas pesam mais do que o título. Nove resolvidos entre 353 problemas de Erdős tentados é uma taxa de acerto de cerca de 2,5 por cento. O número das sequências, 44 de 492, fica abaixo de nove por cento. Os autores admitem sem rodeios que a maioria desses problemas continua fora de alcance, ainda mais os que exigem teoria nova e extensa, e que os acertos se concentram onde a biblioteca matemática do Lean já é profunda. Tire esse andaime construído por humanos e a lista curada de alvos, e o sistema fica sem chão.

A cautela é merecida. Num episódio muito ridicularizado, um laboratório rival anunciou que seu modelo havia resolvido dez problemas de Erdős, até que matemáticos apontaram que as respostas já estavam na literatura publicada. O modelo as tinha encontrado, não demonstrado. O AlphaProof Nexus foi construído para ser imune a esse erro. Uma prova em Lean de um resultado conhecido continua válida, e uma prova em Lean de algo genuinamente novo não dá para fingir. Demis Hassabis, à frente da DeepMind, fez questão de dizer que o trabalho não é inteligência artificial geral, uma nota de prudência incomum numa empresa raramente tímida com seus modelos.

Há um ganho mais sutil que os pesquisadores destacam. Até os fracassos foram úteis. Como cada prova parcial é checada formalmente, os matemáticos puderam ver com exatidão quais submetas o sistema conseguia e quais não conseguia fechar, sem reconferir o argumento inteiro à mão. A máquina deixa de ser um oráculo e vira uma colaboradora incansável que mostra o próprio trabalho e aponta onde a parte difícil ainda se esconde.

O resultado não vem sozinho. Coincide com outra alegação de um modelo de raciocínio rival, que teria refutado uma conjectura de Erdős de cerca de 80 anos em geometria discreta, um achado que matemáticos na ativa refinaram e endossaram. Dois laboratórios, dois métodos, um apoiado na verificação formal e o outro em cadeias de raciocínio em estado bruto, chegaram à mesma fronteira com semanas de diferença. A disputa já não é sobre chatbots que soam espertos.

O trabalho foi detalhado num artigo publicado neste mês, e os métodos se apoiam em ferramentas abertas, a saber o Lean e sua biblioteca construída pela comunidade, de modo que grupos externos podem inspecionar e reexecutar as demonstrações em vez de confiar num blog corporativo. A DeepMind não disse se o sistema chegará a pesquisadores de fora da empresa. O número a observar não é nove. É se esses 2,5 por cento viram dez, e depois vinte, porque no dia em que isso acontecer, a discussão sobre para que servem essas máquinas terá de recomeçar do zero.

Tags: inteligência artificial, Google, Gemini, Paul Erdős, AlphaProof Nexus, Automated Theorem Proving