Did AI Just “Solve” Math? (Let’s Take a Closer Look)
Cal Newport analisa criticamente o anúncio da OpenAI de que um LLM resolveu um problema de geometria discreta de 80 anos. Ele explica o que realmente aconteceu, por que não é um sinal de AGI e defende que a IA deve ser vista como uma ferramenta normal, não como uma ameaça existencial.
Cal Newport — host, cientista da computação teórica, autor
A OpenAI usou um LLM de raciocínio para gerar uma longa cadeia de pensamento; matemáticos humanos extraíram dali a ideia para um contraexemplo à conjectura de Erdős.
O resultado é importante (derrubou uma conjectura famosa), mas não é uma prova da conjectura original — é um contraexemplo, o que é mais fácil de encontrar.
O contraexemplo é uma generalização não trivial da construção original de Erdős, não um salto criativo revolucionário.
IA já vem sendo usada em matemática há anos com arquiteturas modulares (LLM + provador formal + controle lógico); o feito da OpenAI é usar apenas um LLM puro, o que é mais marketing do que avanço técnico.
Matemática e programação são os dois 'tributários' onde LLMs realmente funcionam bem, devido à linguagem estruturada, correção objetiva e dados abundantes.
Resolver um problema de matemática não implica que a IA seja superinteligente em outras áreas — o modelo dos 'tributários' mostra que progresso em um domínio não se transfere automaticamente.
O futuro da matemática com IA é promissor: ferramentas modulares e especializadas aumentarão a produtividade e qualidade dos resultados, mas não substituirão a criatividade humana.
A narrativa apocalíptica em torno de anúncios de IA é prejudicial; deveríamos tratar IA como tecnologia normal, não como prenúncio de uma revolução das máquinas.
O que a OpenAI realmente fez
A OpenAI publicou um preprint afirmando que um modelo de raciocínio (LLM) produziu um contraexemplo à conjectura de Erdős sobre o problema da distância unitária no plano (1946).
Erdős propôs que o número máximo de pares de pontos a distância unitária em um conjunto de n pontos no plano é O(n^(1 + c/log log n)), tendendo a linear assintoticamente.
O contraexemplo mostra que o limite é maior: algo como n^(1 + epsilon) com epsilon constante, não tendendo a zero.
O LLM gerou uma transcrição de ~150 páginas de 'cadeia de pensamento'; matemáticos humanos identificaram ali a ideia central, poliram-na e escreveram o artigo.
O modelo usado foi um 'reasoning LLM' (similar a o1 da OpenAI), que simula memória e iteração ao gerar tokens sequencialmente.
Não se sabe quantas tentativas foram feitas nem quantos prompts foram necessários; o processo foi caro e ineficiente comparado a sistemas modulares.
O resultado é realmente importante?
Sim, é um problema bem conhecido e ninguém havia encontrado um contraexemplo antes.
A conjectura de Erdős era amplamente aceita como verdadeira; provar que ele estava errado é surpreendente.
O resultado é publicável em periódicos de alto impacto (ex.: Annals of Mathematics).
Thomas Bloom, especialista em problemas abertos de Erdős, confirmou a importância, mas fez ressalvas.
Bloom notou que o contraexemplo é uma generalização 'natural, embora altamente não trivial' da construção original de Erdős usando reticulados.
A descoberta exigiu a confluência de fatores: (1) pensar no problema, (2) tentar disprovar a conjectura apesar da crença contrária, (3) generalizar para outros corpos numéricos, (4) conhecer teoria de corpos de classes.
O LLM teve 'paciência sobre-humana' para explorar um caminho que humanos descartariam como não promissor.
LLMs são mais inteligentes que matemáticos humanos?
Não. O LLM não teve um insight criativo; ele simplesmente explorou sistematicamente um espaço de possibilidades que humanos evitariam por ser tedioso.
Bloom compara o resultado a 'achievements anteriores' de IA em matemática: soluções que exigem paciência e conhecimento enciclopédico, não genialidade.
A diferença deste caso é que foi usado um LLM puro, sem arquitetura modular (como Lean + controlador).
Newport argumenta que isso é mais marketing: a OpenAI quer promover seu modelo de raciocínio para IPO.
Sistemas modulares (ex.: AlphaProof Nexus do Google DeepMind) são mais eficientes: resolveram 9 de 353 problemas abertos de Erdős com baixo custo computacional.
O fato de o problema ser famoso é o que torna o anúncio notável, não a capacidade do LLM em si.
Isso significa que todos os problemas difíceis serão resolvidos por IA?
Não. O modelo dos 'tributários' (tributary model) explica: progresso em um domínio (matemática) não se transfere para outros (ex.: negócios, medicina).
Matemática e programação são os dois tributários onde LLMs realmente funcionam devido a: linguagem estruturada, correção objetiva, dados abundantes e usuários especialistas dispostos a lidar com ferramentas complexas.
Se a IA fosse superinteligente, a OpenAI estaria anunciando aplicações lucrativas (ex.: economia de bilhões), não um resultado em geometria discreta.
Gary Marcus ecoou Newport: o anúncio é uma 'vindicação' do modelo dos tributários, pois o caso de uso é o menos lucrativo possível.
A maioria dos problemas abertos de Erdős (344 de 353) não foi resolvida pelo sistema modular do DeepMind, mostrando que a abordagem tem limites.
O futuro da matemática com IA
Ferramentas de IA modulares (LLM + provador formal + controle) estão transformando a prática matemática, assim como LLMs transformaram a programação.
Newport, como ex-matemático aplicado, acredita que tais ferramentas o tornariam 2x mais produtivo em qualidade, abrangência e velocidade.
A matemática combina insight criativo com trabalho tedioso (aprender resultados, tentar abordagens, fazer álgebra); a IA pode automatizar o tedioso.
No curto prazo, haverá uma explosão de resultados 'de baixo pendor' (low-hanging fruit): contraexemplos, refinamentos de limites, etc.
Problema: muitos resultados para serem revisados por pares; qualidade pode ser diluída.
No médio prazo, a qualidade média dos resultados de alto nível deve aumentar, pois matemáticos poderão explorar espaços de prova mais amplos.
Newport vê isso como uma validação de sua visão de 'AGI distribuída' ou 'AGI estreita': sistemas modulares e especializados, não um único LLM gigante.
Crítica à narrativa apocalíptica
Newport critica o discurso maniqueísta que transforma todo anúncio de IA em sinal de revolução das máquinas.
O anúncio deveria ser tratado como uma ferramenta legal para matemáticos, não como ameaça existencial.
A mídia e as empresas de IA lucram com o medo e a excitação exagerados; isso prejudica o debate racional.
Newport pede que tratemos IA como tecnologia normal: útil em nichos, sem implicações cósmicas.
Se há 5 anos alguém dissesse 'temos uma ferramenta que ajuda matemáticos a resolver problemas', ninguém se importaria; hoje causa pânico.
A mensagem final: 'Nada terrível acabou de acontecer. Isso é apenas uma boa notícia, mais restrita do que parece.'
Passos práticos
Matemáticos: explorem sistemas modulares como AlphaProof Nexus para atacar problemas abertos; não dependam de LLMs puros.
Não matemáticos: não entrem em pânico com anúncios de IA; avaliem se o resultado é realmente aplicável a áreas que afetam sua vida.
Leitores de notícias: desconfiem de manchetes sensacionalistas; busquem fontes que expliquem o que realmente foi feito.
Investidores: questionem se o caso de uso apresentado (ex.: matemática pura) é realmente lucrativo ou apenas marketing.
Formuladores de políticas: foquem em regular aplicações específicas de IA, não em cenários apocalípticos genéricos.
Frases marcantes
"Se o resultado fosse uma prova da conjectura de Erdős, isso seria realmente incrível. Mas foi um contraexemplo, e a construção é uma generalização natural, embora não trivial, da construção original de Erdős. — Thomas Bloom"
"O LLM combinou paciência sobre-humana com familiaridade com uma vasta gama de maquinário técnico. — Thomas Bloom"
"Se você quer impressionar investidores, não anuncia que ajudou um matemático a resolver um problema de geometria discreta. Você anuncia que economizou bilhões de dólares para empresas. — Cal Newport"
"Nada terrível acabou de acontecer. Isso é apenas uma boa notícia, mais restrita do que parece. — Cal Newport"
"Podemos tratar IA como uma tecnologia normal, e deixar os nerds da matemática dizerem: 'Essa é uma ferramenta legal, mal posso esperar para usá-la'? — Cal Newport"
Mencionados no episódio
OpenAI — empresa de IA, autora do anúncio
Paul Erdős — matemático húngaro, propôs a conjectura em 1946
Thomas Bloom — matemático, especialista em problemas abertos de Erdős
Peter Diamandis — empreendedor, tuitou sobre o anúncio
Gary Marcus — cientista cognitivo, crítico de IA
AlphaProof Nexus — sistema modular do Google DeepMind para matemática
Lean — linguagem de verificação formal de provas
New Scientist — revista que publicou manchete sobre o feito
Center for Digital Ethics (Georgetown) — instituição onde Newport trabalha