Watts, Wafers, and the Future of AI Infra | Gavin Baker
Gavin Baker, CIO da Atreides Management, analisa o momento extraordinário da IA, comparando o crescimento da Anthropic (US$ 11 bi de ARR em um mês) ao de empresas SaaS consolidadas. Discute a infraestrutura de IA (watts, wafers, computação orbital), a dinâmica de oferta/demanda de chips, os riscos de bolha, a importância da TSMC, e o impacto geopolítico e social da IA. Oferece uma visão densa sobre investimentos em semicondutores, energia e o futuro do setor.
Patrick O'Shaughnessy (host, CEO da Positive Sum)Gavin Baker (CIO da Atreides Management, investidor focado em tecnologia)
A Anthropic adicionou US$ 11 bilhões de ARR em um mês, algo sem precedentes na história do capitalismo, superando a combinação de Palantir, Snowflake e Databricks.
A escassez de wafers controlada pela TSMC é o principal freio a uma bolha de IA; se a TSMC expandir capacidade demais, pode desencadear um overbuild.
A computação orbital (racks no espaço conectados por lasers) é uma solução real para a escassez de energia, com a SpaceX já operando satélites de 20 kW.
A desagregação entre prefill e inferência estende a vida útil das GPUs para 10-15 anos, beneficiando o crédito privado e reduzindo custos de financiamento.
O Vale do Silício está em um momento de 'quebra de diversidade' – quase todos são otimistas com IA, mas as avaliações de empresas de alta qualidade ainda não estão esticadas.
Startups de chips precisam fazer algo 'diferente e difícil' (ex: Cerebras com wafer-scale computing), pois tentar fazer uma GPU melhor que a Nvidia é quase impossível.
A mudança para precificação baseada em uso (pay-per-token) é extremamente otimista para receitas de IA, pois aumenta o consumo, ao contrário do modelo all-you-can-eat.
O maior risco para a tese de IA é uma violação da 'Bitter Lesson' de Sutton, onde a eficiência algorítmica supera o scaling de compute, especialmente com ASI.
O Momento Extraordinário da IA e a Oportunidade de Compra em Março
Gavin Baker descreve março/abril de 2025 como o momento mais extraordinário na história do capitalismo e dos negócios americanos.
A Anthropic adicionou US$ 11 bilhões de ARR em um único mês, enquanto as três maiores SaaS da última década (Palantir, Snowflake, Databricks) levaram 10 anos para construir seus negócios combinados.
Baker diferencia dois tipos de drawdown: quando se está errado (cristaliza perda) e quando se discorda profundamente do preço (pode 'construir alpha futuro'). Março foi o segundo caso.
Ele cita que o mercado deu múltiplas chances de comprar IA barata: 2022, COVID, Deep Seek, e agora março de 2025 – com o sinal mais claro de todos (crescimento da Anthropic).
A avaliação relativa de tech vs. mercado ficou tão barata quanto em qualquer momento dos últimos 10 anos, apesar do momento mais otimista para IA na história.
Baker argumenta que o fechamento do Estreito de Ormuz seria relativamente bom para os EUA, pois o gás natural americano ficou 20% mais barato enquanto o resto do mundo dobrou ou triplicou, melhorando a competitividade manufatureira.
Avaliação de OpenAI e Anthropic: Múltiplos Atrativos e Capital Efficiency
Baker compara Anthropic e OpenAI: Anthropic queimou ~80% menos capital para atingir escala de receita similar, indicando ROIC estrutural muito superior.
OpenAI tem vantagem em acesso a compute (conseguiu mais alocações), mas Anthropic tem custo por token dramaticamente menor.
Se Anthropic tivesse todo o compute que precisa, Baker estima que estaria gerando US$ 100-150 bilhões de ARR hoje (vs. ~US$ 50 bi atuais).
Ele cria o conceito de 'URR' (Unconstrained Run Rate Revenue): a receita que a Anthropic teria sem restrições de compute, o que daria um múltiplo de ~5x sobre esse número.
Sobre por que não levantam mais capital a valuations mais altos: Baker defende que é sábio não ser ganancioso, seguindo o exemplo de Elon Musk (SpaceX), que sempre subprecificou para manter o 'superpoder' de levantar capital quando quiser.
Ele acredita que Anthropic poderia levantar a um prêmio de 100% sobre a última marcação, mas escolhe não fazê-lo para preservar relacionamentos de longo prazo com investidores.
Watts, Wafers e a Infraestrutura de IA
O maior gargalo atual não é energia ou chips, mas zoneamento e aprovações regulatórias para data centers, segundo um grande investidor de PE (Blackstone, Apollo, KKR).
Baker acredita que o capitalismo resolverá a escassez de energia até 2027-28, com aumento de capacidade de turbinas e outras fontes.
A computação orbital é redefinida como 'racks no espaço' (não data centers gigantes): um rack Blackwell de 100 kW com painéis solares de 500 pés e radiadores, em órbita síncrona com o sol.
SpaceX já opera satélites de 20 kW (Starlink V3) e está confiante em escalar para 100-120 kW, resolvendo o resfriamento com radiadores e reparos com Starship.
Os racks no espaço seriam conectados por lasers a vácuo (já usados em Starlink), formando um data center virtual. Treinamento continuará na Terra por muito tempo; inferência é o caso de uso orbital.
Baker alerta que empresas de energia e resfriamento que estão expandindo capacidade podem sofrer quando a computação orbital se tornar realidade, pois a demanda por data centers terrestres pode ser menor do que o esperado.
TSMC, a Barreira contra a Bolha e o Papel da Intel/Samsung
A TSMC é o 'freio' que impede uma bolha de IA: se expandisse capacidade no ritmo que Jensen Huang (Nvidia) quer, a Nvidia poderia vender US$ 2-3 trilhões em GPUs em 2026-27, gerando overbuild.
Baker compara com a teoria de Carlota Perez: mercados eficientes entendem que IA é tecnologia fundamental, mas isso leva a uma 'quebra de diversidade' (todos otimistas) e bolha.
A diferença crucial vs. 2000: o atual build-out é financiado por fluxo de caixa operacional, não dívida. GPUs estão em 100% de utilização, enquanto 99% da fibra ótica em 2000 estava ociosa.
Se TSMC mantiver a disciplina, evita-se a bolha. Mas Intel e Samsung podem 'quebrar' e expandir, forçando todos a seguir. A vantagem de TSMC (9-15 meses à frente) é a chave.
O Terra Fab (joint venture SpaceX/Tesla) pode ser um divisor de águas: parceria com Intel dá acesso a 50 anos de conhecimento, e Elon atrairá os melhores engenheiros e as equipes A das empresas de equipamentos (ASML, KLA, etc.).
Baker acredita que o Terra Fab terá sucesso porque Elon é tratado como 'divindade viva' em Taiwan, China, Coreia e Japão, permitindo recrutar os melhores talentos globais.
Deep Seek, Frontier Tokens e a Bitter Lesson
A reação inicial a Deep Seek (modelo mais eficiente) foi de que modelos menores e mais baratos bastariam, mas a realidade mostrou o contrário: os retornos econômicos estão concentrados nos tokens de fronteira.
Baker cita sua própria experiência: o Gemini 2.0 Pro, que era 'mind-blowing' há 9 meses, hoje é 'intolerável'. A fronteira se move rápido e os usuários se acostumam.
A 'Bitter Lesson' de Richard Sutton diz que mais compute sempre supera engenharia algorítmica. Mas Baker questiona se isso vale para IAs com QI 400+ (ASI), que podem se tornar mais eficientes sozinhas.
O 'Turbo Quad' (otimização de memória do Google) causou queda no mercado, mas nenhum engenheiro de IA acreditava que reduziria a demanda por DRAM. Isso mostra como o mercado reage a ruídos.
Baker vê risco de violação temporária da Bitter Lesson se a ASI decidir se otimizar, mas no geral, mais compute continuará sendo a estratégia vencedora.
Precificação Baseada em Uso e o Futuro dos Modelos de Fronteira
Os modelos de IA estão migrando de preço fixo (all-you-can-eat) para precificação por uso (pay-per-token), o que é extremamente otimista para receitas.
Baker compara com a telefonia celular: quando as operadoras migraram de minutos ilimitados para planos com franquia, o crescimento disparou. O mesmo ocorrerá com IA.
Para entender o que a IA de fronteira realmente pode fazer, é preciso estar em planos empresariais com uso ilimitado (ex: Claude Code, Codex), pois os planos de US$ 250/mês são severamente rate-limited.
Claude agora produz 70% menos tokens para a mesma pergunta (lobotomizado) em planos básicos. A versão completa só está disponível com precificação por uso.
Baker prevê que OpenAI e Anthropic ultrapassarão US$ 200 bilhões de ARR este ano, impulsionados por essa mudança de precificação e pelo aumento do número de agentes por usuário.
O Papel das Novas Empresas de Chips: Diferente e Difícil
Baker usa a metáfora do 'triângulo de ferro' do design de tanques (ataque, defesa, mobilidade) para chips: há trade-offs fundamentais entre memória, largura de banda e computação.
TPU, Trainium e AMD tentam ser 'GPUs melhores', mas é um jogo difícil. Trainium 3 é promissor por ter switch scale-up network para inferência de MoE.
Para startups, a regra é: 1% de market share em chips de IA vale US$ 100 bilhões – um bom resultado de venture. Mas precisa ser algo 'diferente e difícil'.
Cerebras é o exemplo: wafer-scale computing é uma arquitetura radicalmente diferente e difícil de copiar. Eles estão resolvendo o gargalo de I/O com optical wafer e hybrid bonding.
A desagregação de prefill (carga do canhão) e decode (disparo) abre espaço para chips especializados, mas Nvidia pode copiar rapidamente se não for algo realmente difícil.
Baker alerta: se uma startup alega ter acesso especial a um processo da TSMC, Jensen já viu esse processo antes e sabe mais sobre ele do que a startup.
Vida Útil das GPUs, Crédito Privado e o Efeito nos Hyperscalers
A desagregação de inferência estende a vida útil das GPUs para 10-15 anos (até derreterem), o que é ótimo para o crédito privado que financiou GPUs com prazos de 3-4 anos.
Isso reduz o custo de financiamento (de ~7% para 5-6%), tornando o build-out de IA mais barato.
Os hyperscalers (Google, Amazon, Microsoft) têm enormes frotas de CPUs, que se tornam mais importantes em um mundo de agentes (orquestração, tool calls). Isso pode ajudá-los a 'alcançar' os vendedores de escassez.
Baker menciona que a utilidade das GPUs mais antigas (Hopper, Ampere) pode ser estendida colocando sistemas Cerebras ou Groq na frente delas para prefill.
A Camada de Aplicações: Destruição de Valor e a Importância do Token Path
Baker afirma que a IA destruiu trilhões de dólares em valor na camada de aplicações, com exceção de Cursor e Cognition (foco em coding).
O 'token path' (caminho do token) é essencial: empresas como Databricks estão no caminho; as que não estão, sofrem.
Startups de aplicação precisam de um nicho pequeno o suficiente para que os laboratórios de fronteira não entrem, ou construir uma vantagem de dados proprietários.
Se os retornos dos tokens de fronteira caírem, haverá uma explosão de valor na camada de aplicação. Mas hoje, a maior parte do valor está em energia, data centers, chips e modelos.
Baker cita Jamin Ball (Altimeter): 'Se você é uma empresa de software, tem que estar no token path'.
Geopolítica, Segurança e o Impacto Social da IA
Baker está cada vez mais preocupado com a segurança pessoal de líderes de IA, dado o aumento da violência política e a politização da IA (ex: coquetéis molotov na casa de Sam Altman).
A Ucrânia está vencendo devido à superioridade em IA de campo de batalha, o que é desestabilizador para adversários como a China.
Ele defende a criação de uma instituição de caridade para educar o mundo sobre como o Ocidente foi benéfico (ex: fim da escravidão pelo Império Britânico, reconstrução de Alemanha e Japão após 1945).
Baker é um 'maximalista otimista de IA', mas reconhece que é uma descontinuidade. É preciso abordar as preocupações dos ludistas e garantir que a IA beneficie a todos, não apenas aos ricos.
Ele cita o exemplo de um pai que usou IA para encontrar um medicamento no mercado para a doença rara de sua filha, mostrando o potencial transformador da tecnologia.
Análise das Big Techs: Google, Meta, Amazon, Microsoft
Google: perdeu a vantagem do TPU, mas tem o maior estoque de compute do mundo. Dados do YouTube são valiosos para robótica. Baker espera que o Google I/O traga algo que 'leapfrogue' OpenAI/Claude.
Meta: Zuckerberg merece crédito por transformar a Meta em uma empresa AI-first. O modelo Llama 4 (Muse) está próximo da fronteira, e a taxa de mudança é favorável.
Amazon: posição forte com Trainium. A robótica trará eficiência no varejo nos próximos 18 meses. Modelos Nova são melhores do que o crédito que recebem.
Microsoft: Satya Nadella fez a escolha corajosa de usar compute internamente para melhorar produtos próprios (Copilot), em vez de vender GPUs para OpenAI. Isso custou US$ 800 no preço da ação, mas é a decisão certa para o longo prazo.
Baker questiona se Satya se arrepende de não ter apoiado Ilya na tentativa de golpe contra Sam Altman, o que teria mudado a parceria Microsoft-OpenAI.
Engajamento com Startups e o Futuro do Open Source
Amazon e Nvidia são as empresas mais engajadas com startups; Google vem em seguida; AMD, Microsoft e Meta têm engajamento quase zero.
Isso é uma desvantagem, pois os melhores times estão em startups. Baker acredita que isso beneficiará Nvidia, AMD e Google no longo prazo.
Sobre open source: Baker acredita que Jensen manterá os modelos open source alguns passos atrás da fronteira. Open source não é grátis – custa energia e GPUs, e as empresas quase sempre recebem uma parcela da receita.
O novo dilema do prisioneiro é: se todos os laboratórios de fronteira concordarem em não liberar seus modelos via API, o primeiro que trair terá vantagem. Isso pode levar a uma corrida.
Passos práticos
Para investidores: monitore as decisões de capacidade da TSMC – se expandirem demais, pode ser o prenúncio de uma bolha.
Para entender a IA de fronteira: assine planos empresariais com precificação por uso (ex: Claude Code, Codex), não os planos fixos de US$ 250/mês que são rate-limited.
Para founders de chips: foque em arquiteturas 'diferentes e difíceis' (ex: wafer-scale computing), não em tentar fazer uma GPU melhor que a Nvidia.
Para empresas de energia/resfriamento: repense a expansão de capacidade, pois a computação orbital pode reduzir a demanda por data centers terrestres a partir de 2028.
Para proteção pessoal: tenha uma 'palavra de segurança' familiar/empresarial que não possa ser engenheirada socialmente, para evitar golpes de deepfake.
Para investidores de venture: busque empresas no 'token path' ou em nichos tão específicos que os laboratórios de fronteira não queiram entrar.
Para todos: torne-se um 'mestre da metralhadora' (IA) – integre agentes no seu processo de trabalho para aumentar a produtividade, como Baker faz com resumos de podcasts.
Frases marcantes
"Anthropic added $11 billion of ARR in one month. That's nothing like that has ever happened in the history of capitalism."
"If Anthropic had all the compute, they'd probably be doing well north of $100 billion today. Maybe $150."
"The disaggregation of prefill and inference means that GPUs are going to have 10 or 15-year lives. That's going to be really good for the private credit industry."
"The companies that are doing the best today are the ones with the highest ratio of utilized GPUs per human."
"I am more and more worried about personal safety. I hope nothing tragic happens, but there is an upsurge in political violence."
"The Luddites are going to be wrong, but we need to be really thoughtful in how we address their concerns. It is a little dystopian that the best AI is only available to people with a lot of money."
Mencionados no episódio
Anthropic (empresa de IA, criadora do Claude)
OpenAI (empresa de IA, criadora do ChatGPT)
Palantir (empresa de análise de dados)
Snowflake (plataforma de dados em nuvem)
Databricks (plataforma de dados e IA)
Deep Seek (modelo de IA chinês)
TSMC (Taiwan Semiconductor Manufacturing Company, maior fabricante de chips do mundo)
Nvidia (fabricante de GPUs, liderada por Jensen Huang)
Intel (fabricante de chips)
Samsung (fabricante de chips e memória)
SpaceX (empresa aeroespacial de Elon Musk)
Starlink (constelação de satélites da SpaceX)
Starship (foguete reutilizável da SpaceX)
Cerebras (startup de chips wafer-scale)
Google (empresa de tecnologia, dona do Gemini e TPU)
Meta (empresa de tecnologia, dona do Llama)
Amazon (empresa de tecnologia, dona do Trainium e AWS)
Microsoft (empresa de tecnologia, parceira da OpenAI)
Broadcom (fornecedora de ASICs)
AMD (fabricante de GPUs e CPUs)
ASML (fornecedora de máquinas de litografia)
KLA Tencor (fornecedora de equipamentos semicondutores)
Lam Research (fornecedora de equipamentos semicondutores)
Applied Materials (fornecedora de equipamentos semicondutores)
CoreWeave (provedora de nuvem de GPU)
Blackstone (gestora de investimentos)
Apollo (gestora de investimentos)
KKR (gestora de investimentos)
Carlota Perez (autora do livro sobre bolhas tecnológicas)
Richard Sutton (cientista da computação, autor da 'Bitter Lesson')
Jensen Huang (CEO da Nvidia)
Elon Musk (CEO da SpaceX, Tesla, xAI)
Sam Altman (CEO da OpenAI)
Satya Nadella (CEO da Microsoft)
Mark Zuckerberg (CEO da Meta)
Dario Amodei (CEO da Anthropic)
Krishna (CFO da Anthropic, mencionado como convidado do podcast)
Sarah Friar (CFO da OpenAI)
Ilya Sutskever (ex-cientista chefe da OpenAI)
Andrew Feldman (CEO da Cerebras)
Jamin Ball (analista da Altimeter, cunhou 'token path')
George Vanderheide (ex-gestor da Fidelity)
Jennifer Yurig (mentora de Gavin Baker)
Terra Fab (joint venture SpaceX/Tesla para fabricação de chips)
Boom Aerospace (empresa de aviões supersônicos)
Ramp (empresa de software de gestão financeira, patrocinadora)
Vanta (plataforma de compliance e segurança, patrocinadora)
Rogo (plataforma de IA para Wall Street, patrocinadora)
WorkOS (plataforma de APIs para enterprise, patrocinadora)
Ridgeline (plataforma de gestão de investimentos, patrocinadora)
Cursor (IDE com IA)
Cognition (startup de IA para coding)
Replit (plataforma de coding)
Perplexity (buscador com IA)
Vercel (plataforma de front-end)
Stripe (processadora de pagamentos)
Shopify (plataforma de e-commerce)
Wayfair (varejista online de móveis)
Astera Labs (empresa de conectividade para data centers)
Groq (startup de chips LPU, adquirida pela Nvidia)
xAI (empresa de IA de Elon Musk, criadora do Grok)
Claude Code (ferramenta de coding da Anthropic)
Codex (ferramenta de coding da OpenAI)
Copilot (assistente de IA da Microsoft)
GCP (Google Cloud Platform)
Azure (nuvem da Microsoft)
AWS (Amazon Web Services)
HBM (High Bandwidth Memory, tipo de memória para GPUs)
DRAM (Dynamic Random Access Memory)
NAND (tipo de memória flash)
GPU (Graphics Processing Unit)
CPU (Central Processing Unit)
TPU (Tensor Processing Unit, do Google)
Trainium (chip de IA da Amazon)
MI450 (próxima GPU da AMD)
Blackwell (arquitetura de GPU da Nvidia)
Hopper (arquitetura anterior da Nvidia)
Ampere (arquitetura ainda anterior da Nvidia)
MoE (Mixture of Experts, arquitetura de modelo)
RL (Reinforcement Learning)
ASI (Artificial Superintelligence)
ARR (Annual Recurring Revenue)
ROIC (Return on Invested Capital)
LTA (Long-Term Agreement)
PE (Private Equity)
SaaS (Software as a Service)
ASR (Automatic Speech Recognition, mencionado no contexto da transcrição)