🎙️ Invest Like the Best (Patrick O'Shaughnessy) · 2026-05-13

Inside Anthropic's $100 Billion Al Compute Commitment | CFO Krishna Rao

Krishna Rao, CFO da Anthropic, detalha como a empresa gerencia seu compromisso de mais de US$ 100 bilhões em computação, explicando a alocação dinâmica entre três plataformas de chips, a eficiência operacional que gera retornos exponenciais e a tese de que a inteligência de fronteira tem retornos altíssimos, especialmente no mercado empresarial. O episódio oferece uma visão interna rara sobre as decisões financeiras e estratégicas por trás do crescimento explosivo da Anthropic.

Patrick O'Shaughnessy (host do Invest Like the Best)Krishna Rao (CFO da Anthropic)

▶ Assistir no YouTube

Principais lições

A computação é o 'sangue vital' da Anthropic, e a empresa gasta 30-40% do tempo do CFO em decisões de alocação e aquisição de capacidade computacional.
A Anthropic usa três plataformas de chips (Trainium da Amazon, TPU do Google e GPU da Nvidia) de forma fungível, construindo uma camada de orquestração própria para maximizar o ROI de cada dólar de computação.
A eficiência computacional melhora a cada geração de modelo: novos modelos são não apenas mais capazes, mas também mais eficientes em processar tokens, gerando um ciclo virtuoso de redução de custos e aumento de capacidade.
A empresa prioriza manter um piso de computação para desenvolvimento de modelos, mesmo que isso signifique sacrificar receita de curto prazo, pois acredita que os retornos da inteligência de fronteira são extremamente altos, especialmente no segmento enterprise.
A Anthropic vê a inteligência como multidimensional (não apenas QI), incluindo capacidade de realizar tarefas de longo horizonte, uso de ferramentas e agente, o que expande o TAM a cada lançamento de modelo.
A empresa utiliza seus próprios modelos internamente para acelerar o desenvolvimento: mais de 90% do código da Anthropic é escrito pelo Claude Code, e o Claude é usado para gerar demonstrações financeiras e relatórios mensais, reduzindo o tempo de análise de horas para 30 minutos.
O 'cone de incerteza' é a estrutura central para planejamento: devido ao crescimento exponencial, pequenas variações nas taxas mensais levam a resultados drasticamente diferentes, exigindo flexibilidade nos contratos de computação e na alocação interna.
A cultura da Anthropic é colaborativa, transparente e focada em talento denso, não em massa; isso permitiu reter talentos mesmo quando concorrentes ofereciam salários mais altos, e é um diferencial competitivo chave.

A importância estratégica da computação e o 'cone de incerteza'

Krishna Rao afirma que a computação é o 'sangue vital' da Anthropic, a tela sobre a qual tudo é construído. As decisões de quanto comprar são as mais consequentes e difíceis da empresa: comprar demais leva à falência; comprar de menos impede servir clientes e ficar na fronteira.
O 'cone de incerteza' é o framework central: em um negócio de crescimento exponencial, pequenas variações nas taxas mensais de crescimento se compõem em resultados muito diferentes. A empresa modela cenários em um horizonte de 1-2 anos e trabalha de trás para frente.
A flexibilidade é incorporada tanto nos contratos de computação quanto no uso interno. A empresa usa três plataformas de chips (Trainium, TPU, GPU) de forma fungível, construindo uma camada de orquestração própria que permite alocar dinamicamente cada tipo de computação para a carga de trabalho mais adequada.
Essa flexibilidade levou anos para ser construída. Quando começaram a usar TPUs em escala, muitos achavam loucura, mas o investimento valeu a pena. Hoje, a Anthropic se considera a usuária mais eficiente de computação entre os laboratórios de fronteira.
A empresa trabalha em estreita colaboração com os fornecedores de chips (ex: Annapurna Labs da Amazon) para influenciar o roadmap, pois suas cargas de trabalho estressam os limites do hardware. Isso faz com que cada dólar de computação gere mais retorno do que em qualquer outro lugar.
A alocação de computação é decidida de forma colaborativa, não em silos. Existe um piso mínimo para desenvolvimento de modelos (treinamento e pesquisa), mesmo que isso signifique sacrificar receita de curto prazo. A partir daí, a alocação entre customer serving, uso interno e desenvolvimento é ajustada dinamicamente com base no ROI.

Eficiência computacional e o ciclo virtuoso dos modelos

A eficiência computacional melhora a cada geração de modelo. Diferente de carros (onde mais potência geralmente significa menos eficiência), na Anthropic novos modelos trazem ganhos simultâneos de capacidade e eficiência no processamento de tokens.
Por exemplo, ao passar do Opus 4 para o 4.5, 4.6 e 4.7, cada salto gera um multiplicador de eficiência. Isso beneficia tanto clientes (modelos mais baratos e rápidos) quanto o desenvolvimento interno (RL mais eficiente, pois o modelo faz inferência dentro de um sandbox).
Entre gerações de modelos, a equipe de pesquisa implanta continuamente melhorias incrementais de eficiência, não apenas saltos discretos. Isso é alimentado pelo próprio uso dos modelos internamente.
A eficiência é medida de várias formas: desde a perspectiva do modelo (comparação de curvas de perda em pré-treinamento e RL) até o feedback dos clientes sobre capacidades reais. A empresa não se baseia apenas em benchmarks públicos, que muitas vezes estão saturados.
O ciclo virtuoso: modelos mais eficientes permitem servir mais tokens a menor custo, o que aumenta o consumo (Jevons paradox), gerando mais receita e mais dados para treinar o próximo modelo, que será ainda mais eficiente.

Retornos da inteligência de fronteira e crescimento do TAM

Krishna Rao afirma que os retornos da inteligência de fronteira são extremamente altos, especialmente no segmento enterprise. Cada novo modelo desbloqueia um TAM maior, permitindo casos de uso que antes eram impossíveis.
Exemplo concreto: a Anthropic começou 2024 com cerca de US$ 9 bilhões de run rate de receita e terminou o primeiro trimestre com mais de US$ 30 bilhões. Esse crescimento foi impulsionado pelos saltos de inteligência dos modelos e pelos produtos construídos em torno deles.
A inteligência é multidimensional: não é apenas um QI, mas inclui capacidade de realizar tarefas de longo horizonte, usar ferramentas (computer use), executar tarefas agênticas e fazer tudo mais rápido. Um funcionário que faz em um dia o que outro leva uma semana pode ser 7x mais produtivo, mesmo tendo a mesma capacidade bruta.
A empresa vê a adoção em enterprise como muito mais rápida do que em ondas tecnológicas anteriores (como cloud). Clientes da Fortune 10 já estão usando Claude em cargas de trabalho sensíveis, e a taxa de retenção líquida anualizada é superior a 500%.
O CFO assinou compromissos de milhões de dólares em um Uber de 20 minutos a caminho da gravação, ilustrando a velocidade com que clientes estão adotando a plataforma.

Recursive self-improvement e aceleração do progresso

Mais de 90% do código da Anthropic é escrito pelo Claude Code, e grande parte do código do Claude Code é escrito por ele mesmo. Isso exemplifica o autoaperfeiçoamento recursivo: os modelos ajudam a construir a próxima geração de modelos.
A empresa não vê o progresso como linear, mas acelerado. As scaling laws continuam válidas e não mostram sinais de desaceleração. Os fundadores da Anthropic são autores dos papers originais sobre scaling laws, mas a empresa mantém uma postura cética e desafia constantemente as próprias suposições.
O talento humano continua sendo crucial, mas agora é amplificado pelos modelos. A empresa busca 'densidade de talento' em vez de 'massa de talento': ter as melhores pessoas, equipadas com os melhores modelos, é uma combinação vencedora.
O ritmo de inovação em produtos também acelera: em janeiro, a Anthropic lançou 30 novos produtos e funcionalidades. Isso é possível porque os modelos permitem que equipes pequenas (às vezes um PM e dois engenheiros) entreguem diariamente, com uma frota de agentes trabalhando em paralelo.

Estratégia de plataforma vs. aplicações verticais

A Anthropic se vê principalmente como uma plataforma, análoga aos primeiros dias da AWS. A maioria dos recursos é construída para que outras empresas construam sobre eles: API, prompt caching, Claude Code, Claude Agent SDK, etc.
A empresa também constrói aplicações próprias (como Claude Code e Co-work) em duas situações: (1) quando tem uma visão de para onde os modelos estão indo e quer demonstrar valor antes que o mercado chegue lá; (2) para mostrar ao ecossistema como usar a plataforma de forma eficaz, que outros podem emular.
Mesmo nas aplicações verticais, a abordagem é colaborativa: parcerias com empresas de segurança, design, finanças, etc. A empresa acredita que tanto a plataforma quanto os clientes podem ganhar, e que a maior parte do valor será capturada por quem constrói sobre a plataforma.
Krishna reconhece que alguns clientes temem que a Anthropic se torne concorrente, mas argumenta que a transparência e a parceria são fundamentais. A empresa trabalha em programas de early access e ouve atentamente as necessidades dos clientes.

Precificação, margens e o paradoxo de Jevons

A Anthropic fez poucas mudanças de preço ao longo do tempo. A maior foi reduzir o preço da família Opus quando lançou o Opus 4.5, porque percebeu que os clientes estavam subutilizando o modelo (tentando encaixar problemas de Opus em cargas de trabalho de Sonnet).
A redução de preço gerou o paradoxo de Jevons: o consumo aumentou muito mais do que proporcionalmente à queda de preço, porque os clientes encontraram novos casos de uso viáveis economicamente.
A empresa pensa em margens em termos de retorno sobre o gasto total com computação (ROI on compute), não como margem por transação. A computação é um recurso fungível que suporta receita de curto prazo (inferência), médio prazo (desenvolvimento de produtos) e longo prazo (P&D de modelos).
O CFO afirma que os retornos sobre o envelope total de computação são robustos, e que a empresa equilibra entregar valor aos clientes com gerar retornos fortes para si mesma. A receita cresceu sem um aumento proporcional na computação, porque a eficiência melhorou.

Parcerias com provedores de nuvem e chips

A Anthropic é o único laboratório de linguagem que usa as três principais plataformas de chips (Trainium, TPU, GPU) e está presente nas três nuvens (AWS, GCP, Azure). Isso é uma vantagem estratégica de flexibilidade.
As parcerias vão além da compra de capacidade: há colaboração profunda no desenvolvimento de chips (ex: com Annapurna Labs na AWS), planejamento conjunto de capacidade e distribuição conjunta para clientes.
Exemplos recentes: parceria com xAI/SpaceX para o cluster Colossus em Memphis (computação de curto prazo); acordo de 5 GW com Google e Broadcom para TPUs a partir de 2027; acordo com Amazon para Trainium de até 5 GW (compromisso total superior a US$ 100 bilhões).
A empresa avalia cada oportunidade de computação com base em preço, duração, localização, tipo de chip e eficiência operacional. O mesmo processo é usado para acordos de curto e longo prazo, variando apenas o horizonte temporal.
A capacidade de consumir rapidamente novos lotes de computação heterogênea melhorou drasticamente: há um ou dois anos, seria difícil; hoje, a empresa pode implantar quase qualquer tipo de computação muito rapidamente.

Uso interno de Claude na finance e na operação

A Anthropic usa Claude extensivamente internamente. O CFO descreve como a equipe financeira criou uma biblioteca de 70 'skills' específicas para finanças, acessíveis por meio de um repositório comum.
Um exemplo é o MFR (Monthly Financial Review): Claude produz 90-95% do relatório automaticamente, incluindo análise de drivers (não apenas reportar o que aconteceu, mas por que aconteceu). O tempo de produção caiu de horas para 30 minutos, liberando a equipe para discussões estratégicas.
O head de tax é o maior usuário de tokens na equipe financeira, usando Claude para automatizar grande parte do trabalho de política tributária. Isso mostra que a adoção não se limita a jovens engenheiros, mas inclui profissionais seniores.
A empresa também usa Claude para gerar demonstrações financeiras estatutárias de todas as entidades legais (com revisão humana). O CFO acredita que, se a própria empresa não for superusuária de seus produtos, não pode esperar que os clientes o sejam.

Captação de recursos e evolução da percepção dos investidores

Krishna Rao entrou na Anthropic há dois anos, durante o fechamento da Série D. Na época, as perguntas dos investidores eram: 'Por que você precisa de um modelo de fronteira?', 'Segurança de IA e construir um grande negócio não são opostos?', 'Sua força de vendas é muito pequena'.
Na Série E (final de 2024), o negócio já tinha ~US$ 1 bilhão de run rate, mas o fechamento coincidiu com a notícia do DeepSeek, gerando volatilidade. Investidores questionavam se o crescimento era sustentável e se a adoção em enterprise não seria lenta (como foi com cloud).
A tese que se provou: crescimento liderado por modelos, habilitado por produtos e distribuição. A empresa levantou US$ 75 bilhões desde que o CFO entrou, com mais US$ 50 bilhões previstos dos acordos com Amazon e Google.
O CFO destaca que o investimento em segurança de IA (interpretabilidade, alignment) tem um efeito colateral positivo para o negócio: empresas confiam mais na Anthropic para cargas de trabalho sensíveis, sabendo que a empresa investe em segurança. Isso ajudou a conquistar 9 das 10 maiores empresas da Fortune.
A maior dificuldade de explicar aos investidores hoje é o paradigma de uso fungível da computação: não é um custo variável separado entre P&D e COGS, mas um recurso que pode ser usado para treinamento de manhã e inferência à tarde, gerando retorno em diferentes horizontes de tempo.

Cultura organizacional e retenção de talentos

A Anthropic tem sete cofundadores ainda ativos, o que 'não deveria funcionar no papel', mas funciona na prática. Eles definem o tom da cultura, que é colaborativa, humilde e focada no longo prazo.
A empresa realiza entrevistas de cultura que são levadas a sério: um candidato pode ser brilhante tecnicamente, mas ser rejeitado se não passar no crivo cultural. Não se toleram 'fiefdoms', cotoveladas ou necessidade de tomar crédito.
A cultura é transparente: o CEO Dario Amodei faz uma reunião geral a cada duas semanas, escreve um documento curto sobre 3-4 tópicos e responde perguntas abertas da empresa. Não são perguntas plantadas, e ele responde o melhor que pode.
A retenção de talentos é excepcional: quando concorrentes como Meta ofereceram pacotes enormes para pesquisadores de LLMs, a Anthropic perdeu apenas duas pessoas, enquanto outros laboratórios perderam dezenas. O CFO atribui isso à cultura e ao senso de missão.
A empresa valoriza 'densidade de talento' sobre 'massa de talento': prefere ter um grupo pequeno de pessoas excepcionais, amplificadas pelos melhores modelos, do que um grande número de pessoas medianas.

Riscos, regulação e o futuro da IA

O CFO reconhece que a IA é menos popular que o Congresso entre o público geral, e que a indústria precisa fazer um trabalho melhor de comunicar os benefícios (ex: curas de doenças, melhoria na saúde global) sem ignorar os riscos.
A Anthropic adota uma abordagem equilibrada: Dario Amodei escreveu o ensaio 'Machines of Loving Grace' sobre o potencial transformador, mas a empresa também fala abertamente sobre os riscos. A transparência gera confiança.
O lançamento do modelo Mythos foi feito de forma faseada porque a capacidade em cybersecurity era muito alta: o modelo encontrou 250 vulnerabilidades em um código aberto onde um modelo anterior encontrou 22. A empresa optou por liberar primeiro para grupos controlados, focando no uso defensivo.
Sobre regulação: a Anthropic é 'America first' e quer que a tecnologia beneficie os EUA e países democráticos. A empresa trabalhou com o governo no processo do Mythos e acredita que a regulação tem um papel, desde que não desacelere a inovação.
O CFO vê o futuro como um 'colaborador virtual' que tem contexto da organização, usa ferramentas específicas, aprende com erros e trabalha em tarefas de longo horizonte. O produto Co-work (crescendo mais rápido que Claude Code no mesmo ponto da curva) é um passo nessa direção.

Reflexões pessoais do CFO e o que mais o entusiasma

Krishna Rao descreve como teve que mudar seu pensamento de linear para exponencial. Quando entrou na empresa, a receita era de US$ 250 milhões e o plano era chegar a US$ 1 bilhão; ele perguntou 'em que ano?', pensando linearmente. Dario Amodei era um previsor muito melhor da receita.
Uma caminhada de 2,5 horas com Tom Brown (chief compute officer) antes de começar na empresa foi formativa: Tom descreveu um futuro que parecia ficção científica, mas muito do que foi dito se concretizou. Isso o preparou para a magnitude do desafio.
Ele tenta contratar 'parceiros', não subordinados, e valoriza perspectivas diversas (veio do private equity na Blackstone). Acha importante ter momentos de quietude para apreciar a oportunidade única de trabalhar na Anthropic neste momento.
O que mais o entusiasma é o potencial da IA em biotecnologia e saúde: diagnósticos de doenças incuráveis que podem ter cura encontrada dentro da vida do paciente, aceleração do desenvolvimento de medicamentos (papéis, relatórios, descoberta de moléculas e proteínas).
Ele acredita que a IA pode aumentar em 10x ou 100x o throughput de laboratórios, permitindo curas para doenças raras e melhorando a qualidade de vida globalmente.

Passos práticos

Empresas que usam modelos de IA devem monitorar não apenas a capacidade bruta, mas a eficiência por token, pois modelos mais novos podem ser simultaneamente mais capazes e mais baratos por token.
Ao negociar contratos de computação, busque flexibilidade para realocar recursos entre treinamento, inferência e P&D, e considere múltiplos fornecedores de chips para evitar dependência.
Adote uma abordagem de 'cone de incerteza' para planejamento: modele cenários com crescimento exponencial e prepare-se para uma ampla gama de resultados, em vez de uma previsão pontual.
Invista em ferramentas internas de IA para automatizar tarefas repetitivas (como relatórios financeiros) e liberar tempo da equipe para análise estratégica. Crie uma biblioteca de 'skills' específicas para seu domínio.
Ao lançar modelos de IA com capacidades potencialmente perigosas (ex: cybersecurity), considere uma liberação faseada para grupos controlados, focando em usos defensivos e monitorando impactos.
Para empresas que constroem sobre plataformas de IA, foque em casos de uso que se beneficiem da melhoria contínua dos modelos subjacentes, e esteja preparado para migrar para novos modelos à medida que forem lançados.
Cultive uma cultura organizacional colaborativa e transparente, com reuniões abertas de liderança e entrevistas culturais rigorosas, para reter talentos mesmo em um mercado competitivo.

Frases marcantes

"A computação que adquirimos é o sangue vital do nosso negócio. É a coisa mais importante da empresa, a tela sobre a qual tudo é construído."

"Se você comprar computação demais, vai à falência. Se comprar de menos, não consegue atender seus clientes e não fica na fronteira. É a mesma coisa."

"Pensamos na inteligência como multidimensional, não apenas um QI. O que importa é a capacidade real do modelo no mundo real."

"Os retornos da inteligência de fronteira são extremamente altos, especialmente no enterprise. Cada geração de modelo desbloqueia mais TAM, mais casos de uso."

"Mais de 90% do nosso código é escrito pelo Claude Code. E grande parte do código do Claude Code é escrito por ele mesmo."

"Nosso net dollar retention rate é superior a 500% anualizado. Assinei compromissos de milhões de dólares em um Uber de 20 minutos."

Mencionados no episódio

Claude Code (ferramenta de codificação agêntica da Anthropic)
Co-work (produto da Anthropic para colaboração com IA)
Mythos (modelo de IA da Anthropic com capacidades avançadas de cybersecurity)
Opus 4.5, 4.6, 4.7 (famílias de modelos da Anthropic)
Sonnet 3.5, 3.6 (modelos da Anthropic)
Haiku (modelo da Anthropic)
Trainium (chip da Amazon para treinamento de IA)
TPU (Tensor Processing Unit do Google)
GPU Nvidia (unidades de processamento gráfico da Nvidia)
Annapurna Labs (subsidiária da Amazon que desenvolve chips)
Broadcom (fornecedor de chips para TPUs)
Colossus (cluster de computação da xAI/SpaceX em Memphis)
AWS (Amazon Web Services)
Google Cloud Platform
Microsoft Azure
Fortune 10 (as 10 maiores empresas da Fortune 500)
FTX (exchange de criptomoedas que liquidou ações da Anthropic)
DeepSeek (empresa de IA chinesa que causou volatilidade no mercado)
Dario Amodei (CEO da Anthropic)
Tom Brown (chief compute officer da Anthropic)
Brian Chesky (CEO do Airbnb)
Blackstone (empresa de private equity onde Krishna Rao trabalhou)
Machines of Loving Grace (ensaio de Dario Amodei sobre o potencial da IA)
Jevons paradox (fenômeno onde maior eficiência leva a maior consumo)
Cone of uncertainty (framework de planejamento para cenários exponenciais)
Ramp (empresa de software de gestão de gastos, patrocinadora)
Vanta (plataforma de automação de compliance e segurança, patrocinadora)
Rogo (plataforma de IA para Wall Street, patrocinadora)
WorkOS (plataforma de enterprise readiness, patrocinadora)
Ridgeline (plataforma unificada para gestão de investimentos, patrocinadora)
Felix by Rogo (agente de finanças pessoais, patrocinador)