🎙️ Moonshots (Peter Diamandis) · 2026-05-21

Google I/O 2026, Karpathy Joins Anthropic, and Cerebras’ $95B IPO | EP #256

O episódio cobre o Google I/O 2026, com foco nos novos modelos Gemini Omni e 3.5 Flash, agentes como Anti-Gravity 2.0 e Gemini Spark, e a integração profunda com o ecossistema Google. Também discute a contratação de Andre Karpathy pela Anthropic, a vitória da OpenAI no processo de Elon Musk, e o IPO recorde da Cerebras (US$ 95 bi), com entrevista do CEO Andrew Feldman sobre wafer-scale computing e o futuro da inferência de IA.

Peter Diamandis – host, empreendedor e futuristaDave (DB2) – investidor em IA, 'imperador'Salim – professor de organizações exponenciaisAlex (AWG) – analista de IA, 'superinteligência artificial'Andrew Feldman – CEO da Cerebras

▶ Assistir no YouTube

Principais lições

Google aumentou CapEx em 6x (para ~US$ 180-190 bi/ano) e processa 3,2 quadrilhões de tokens/mês, mostrando escala incomparável.
Gemini Omni é o modelo multimodal mais ambicioso do Ocidente, capaz de gerar vídeo, áudio e texto a partir de qualquer entrada, incluindo simulações físicas.
Gemini 3.5 Flash é 4x mais rápido que modelos concorrentes, mas não lidera em capacidade bruta; Google foca em throughput e tool use.
Anti-Gravity 2.0 e Gemini Spark são cópias tardias de Cursor e OpenClaw, mas se beneficiam da integração com o ecossistema Google (2,5 bi usuários no AI Overviews).
SynthID foi adotado por OpenAI, Nvidia e Eleven Labs, criando um padrão de autenticação de conteúdo sintético – primeiro passo para autorregulação da indústria.
Cerebras teve IPO recorde (US$ 95 bi, alta de 68%) por ser 15-20x mais rápida que GPUs em inferência, usando wafer-scale com SRAM (40-50 GB) e divisão eficiente de modelos grandes.
Andre Karpathy juntou-se à Anthropic para usar Claude na aceleração do próprio pré-treinamento, sinalizando que a fronteira exige estar dentro de um laboratório de ponta.
O processo de Elon Musk contra OpenAI foi rejeitado por prescrição; o episódio critica a distração e defende que ambos foquem em construir.

Google I/O 2026: Números de Escala e CapEx

Google processa 3,2 quadrilhões de tokens/mês (7x mais que no I/O anterior), com 19 bi tokens/minuto via APIs.
CapEx anual saltou de US$ 31 bi (2022) para ~US$ 180-190 bi (2026) – 6x em 4 anos, algo impensável há 5 anos.
13 produtos com >1 bi usuários, 5 com >3 bi; AI Overviews tem 2,5 bi usuários/mês; Gemini app passou de 400 mi para 900 mi MAU em 1 ano.
Mais de 50 bi imagens geradas com modelos Nano Banana; 8,5 mi desenvolvedores usam modelos mensalmente.
TPUs próprias oferecem 2x melhor performance por watt; Google escala treino distribuído em >1 mi TPUs globalmente.
Apesar do ceticismo de 18 meses atrás (Google 'cozido'), a empresa está 'disruptando os disruptores' com integração vertical do chip ao usuário.

Gemini Omni: Modelo Multimodal de Próxima Geração

Gemini Omni gera vídeos a partir de texto, fotos, vídeos e áudio – 'crie qualquer coisa de qualquer entrada'.
Capaz de simular fenômenos físicos como energia cinética e gravidade, com exemplos como explicador claymation de folding de proteínas.
Edição de vídeo por linguagem natural: é possível modificar selfies em tempo real (trocar roupas, cenários).
Google DeepMind é o único laboratório americano de fronteira ainda perseguindo multimodalidade agressivamente; OpenAI cortou Sora, Anthropic foca em código.
Visão de longo prazo inclui tratar sequências biológicas (DNA, proteínas) como modalidades adicionais, buscando 'modality scaling'.
Potencial educacional imenso: visualizações 3D em tempo real para química, biologia, etc.

Gemini 3.5 Flash: Velocidade vs. Capacidade Bruta

Gemini 3.5 Flash é o novo padrão do Gemini app e AI Mode; supera 3.1 Pro em quase todos os benchmarks.
É 4x mais rápido em tokens/s que outros modelos de fronteira, colocando-o em 'liga própria' no gráfico inteligência vs. velocidade.
Destaque no benchmark GDP-val, que mede tarefas economicamente valiosas – sinal de foco em tool use e agentic tasks.
Alex classifica como 'mid': não compete com GPT 5.5 high ou Claude em capacidade bruta, mas é ótimo para throughput.
Sundar indicou que Gemini 3.5 Pro chegará em um mês – estratégia de 'fast follower' em capacidade, líder em velocidade.
Google escolheu a métrica mais favorável (throughput vs. performance) para se posicionar, em vez de comparar diretamente com concorrentes.

SynthID e Autorregulação da Indústria

SynthID já marcou 100 bi imagens/vídeos e 60 mil anos de áudio; agora adiciona verificação de credenciais de conteúdo.
OpenAI, Kakao e Eleven Labs adotaram SynthID – movimento de padronização entre concorrentes.
Dave argumenta que é o primeiro passo para autorregulação da indústria, já que o Congresso não consegue acompanhar o ritmo da IA.
Salem: 'Escassez = abundância - confiança'; resolver confiança permite abundância. Estamos entrando na 'era da verificação'.
Custo de gerar conteúdo cai a zero; valor migra para filtragem e autenticidade – 'autenticidade pode valer mais que criatividade'.
Peter: 'confiança em instituições legadas está colapsando, e a IA está construindo a infraestrutura para entregar confiança'.

Anti-Gravity 2.0 e Gemini Spark: Agentes e Código

Anti-Gravity 2.0 é um app desktop standalone para orquestrar múltiplos agentes de código em paralelo; substitui a visão de código por uma interface agente-first.
Demonstração: construiu um sistema operacional (Doom) a partir de prompt, escrevendo 100+ linhas de código.
Alex critica como 'cópia tardia' do Cursor; Dave nota que é idêntico ao novo Cursor, mas mais radical (esconde o código).
Gemini Spark é o 'OpenClaw do Google': agente 24/7 rodando em VM dedicada no GCP, integrado com Gmail, Sheets, etc.
Exemplo: Spark cria planilha de RSVP que atualiza automaticamente com base em e-mails – integração profunda com ecossistema Google.
Dave: 'é o sistema operacional para sua vida'; Alex: 'produto preguiçoso e seguro, não empurra a fronteira'.
Google aposta em distribuição massiva (mais da metade do mundo usa Google) para tornar agentes mainstream, mesmo que não sejam os mais avançados.

AI Search Mode e Universal Cart

Nova caixa de busca inteligente se expande com a curiosidade do usuário, oferecendo sugestões de IA que vão além do autocomplete.
Agentes persistentes de busca: ao procurar apartamento, o agente varre continuamente a web, redes sociais e fóruns por novas ofertas.
Universal Cart: carrinho de compras universal que funciona em YouTube, Search, Gemini e Gmail, agregando produtos de Nike, Target, Walmart, Shopify.
Carrinho monitora preços, alerta sobre quedas e sugere ofertas – 'reinventando a experiência de compra'.
Elefante na sala: Amazon provavelmente não adotará o padrão; Google compete com Amazon tanto no varejo quanto na nuvem (GCP vs. AWS).
Salem: 'vamos de intenção a agente a transação'; CMOs terão que convencer 100 milhões de agentes a escolher seus produtos.

Notebook LM, Gemini App e Áudio Glasses

Notebook LM gerou 1,5 bi notebooks, podcasts e slides; disponível em 230+ países e 70+ idiomas, com sotaques regionais.
Gemini Omni chega ao Gemini app: exemplo de musicista que cria teaser de música a partir de vídeo bruto e imagens de referência.
Daily Brief: agente matinal que sintetiza e-mail, calendário e notícias, permitindo ações inline (ex.: reagendar voo).
Alex critica fragmentação de marcas (Notebook LM, Spark, Flash, Anti-Gravity) e pede unificação – 'mais madeira atrás de menos flechas'.
Google anuncia parceria com Samsung e Xreal para óculos de áudio (sem display) com Gemini, chegando no outono de 2026.
Óculos focam em áudio privado, câmera sempre ligada (baixo consumo) e integração com smartphone – sem display para maximizar bateria.
Dave alerta para risco social: metade da sociedade gravando tudo pode gerar reação negativa (como 'Glassholes' do Google Glass original).

Gemini for Science e X Prize

Demis apresentou 'Gemini for Science': protótipos para acelerar pesquisa – resumo de papers, transformar metas em código, gerar hipóteses.
Modelos de simulação: previsão de furacões mais rápida e precisa que sistemas tradicionais; Isomorphic Labs em estágio pré-clínico para imunoterapia e câncer.
Demis: 'estamos no sopé da singularidade' – frase que Alex já usou antes.
Build with Gemini X Prize: US$ 2 mi em prêmios para apps que resolvam problemas reais, impactando 100 mil+ pessoas em 90 dias.
Times descrevem o problema e o mercado em inglês; agentes constroem o produto, site e marketing; vence quem gerar mais receita.
Peter: 'ensinar a pescar em vez de dar o peixe'; prêmio será entregue no Moonshots Gathering em 25 de setembro.

Andre Karpathy na Anthropic e o Processo OpenAI vs. Elon Musk

Andre Karpathy juntou-se à Anthropic para liderar iniciativa de usar Claude para acelerar o próprio pré-treinamento (recursive self-improvement).
Em podcast anterior, Karpathy disse que quem está fora de um laboratório de fronteira perde o contato com o que realmente importa – 'seu julgamento deriva'.
Dave: 'ele percebeu que não pode mais ficar só postando no Git; precisa de acesso às máquinas grandes'.
Júri federal rejeitou por unanimidade o processo de Elon Musk contra OpenAI em apenas 2 horas, por prescrição (fora do prazo legal).
Andrew Feldman: 'brigas de bilionários não me interessam; ambos são pensadores importantes e devem focar em construir'.
Peter critica o desperdício de tempo e dinheiro; Dave nota que o recurso de Elon provavelmente falhará, e o processo será irrelevante na escala da singularidade.

Cerebras IPO e Wafer-Scale Computing (Entrevista com Andrew Feldman)

Cerebras levantou US$ 5,5 bi no IPO, maior desde Uber (2019); ações subiram 68%, market cap de US$ 95 bi.
Fundada em 2015 com duas apostas contrárias: (1) IA precisaria de silício dedicado, não GPUs derivadas; (2) clean-sheet design com wafer-scale (chip do tamanho de um prato de jantar, 58x maior que chips normais).
Usa SRAM em vez de HBM/DRAM: SRAM é rápida mas de baixa densidade; ao ter área enorme, podem 'encher até as guelras' de SRAM, obtendo 15-20x mais velocidade em inferência que GPUs.
Primeira geração vendeu apenas 12 sistemas; segunda, 300-350; terceira, milhares. Demanda explodiu em 2024-25 quando modelos ficaram 'espertos o suficiente' para inferência em massa.
Acordo com OpenAI >US$ 20 bi em vários anos (dez/2025); term sheet com AWS para implantação em data centers (março).
Para modelos de 1 tri parâmetros (ex.: Kimiko 2), Cerebras atinge ~1000 tokens/s vs. 70 tokens/s de GPUs otimizadas (Fireworks) – 15x mais rápido.
Feldman critica métricas enganosas de concorrentes: 'GPU gera milhões de tokens agregados, mas só 1-2 usuários a 200 tok/s; uma solução de US$ 4 mi para um usuário'.
Sobre Terafab (Elon Musk): 'construir fabs é muito mais difícil que carros ou foguetes; levará 15-20 anos, não 5-10; TSMC é a maior manufatura do mundo e ainda assim tem desafios'.
Ressalta a importância do ecossistema de packaging (ASE, deposição de RDL, etc.), que os EUA perderam quando as fabs saíram.

Passos práticos

Experimente o Gemini 3.5 Flash no Gemini app e AI Mode para sentir a velocidade em tarefas cotidianas.
Use o SynthID para verificar a autenticidade de imagens e áudio – comece a confiar em conteúdo com credenciais.
Instale o Anti-Gravity 2.0 e tente construir um pequeno projeto sem olhar código – apenas descrevendo o que quer.
Configure um agente persistente no Google Search para monitorar algo (ex.: preço de um produto, novas ofertas de imóveis).
Participe do Build with Gemini X Prize: escolha um problema, descreva-o em inglês e deixe os agentes construírem o app.
Se você é desenvolvedor, teste o Gemini Spark para automatizar tarefas no Gmail e Google Sheets.
Para empresas: avalie a Cerebras para inferência de alto throughput se precisar de latência muito baixa (ex.: chatbots em tempo real).
Leia o 'peanut butter manifesto' de Brad Garlinghouse para entender os desafios de inovação em grandes empresas como Google.

Frases marcantes

"Se você dissesse há 5 anos 'Google vai 6x o CapEx e a ação vai subir', ninguém em sã consciência diria que é possível."

"Estamos no sopé da singularidade. – Demis Hassabis"

"Escassez = abundância - confiança. Se você resolver a confiança, resolve a abundância. – Jure Miklavc (citado por Salim)"

"O futuro não é algo que acontece conosco; é algo que projetamos. – Peter Diamandis"

"Construir fabs é como construir pirâmides. Leva 5-6 anos e US$ 40-50 bi, mesmo para quem já construiu a última. – Andrew Feldman"

"Se você não está em um laboratório de fronteira, seu julgamento sobre o que está por vir inevitavelmente deriva. – Andre Karpathy"

Mencionados no episódio

Google I/O 2026 – conferência anual de desenvolvedores do Google
Gemini Omni – novo modelo multimodal do Google DeepMind
Gemini 3.5 Flash – modelo rápido e eficiente do Google
SynthID – ferramenta de marca d'água para conteúdo de IA
Anti-Gravity 2.0 – app agente-first para desenvolvimento de código
Gemini Spark – agente 24/7 integrado ao ecossistema Google
Universal Cart – carrinho de compras universal do Google
Notebook LM – ferramenta de notas e podcasts do Google
Cerebras – empresa de wafer-scale computing, IPO de US$ 95 bi
Andrew Feldman – CEO da Cerebras
Andre Karpathy – co-fundador da OpenAI, agora na Anthropic
Anthropic – laboratório de IA, criador do Claude
OpenAI – criadora do ChatGPT, GPT-5.5
Elon Musk – CEO da Tesla, SpaceX, fundador da xAI
Terafab – projeto de fab de Elon Musk
TSMC – Taiwan Semiconductor Manufacturing Company
Nvidia – fabricante de GPUs para IA
Cursor – IDE agente-first para código
OpenClaw – agente autônomo da Anthropic
X Prize – fundação de competições de inovação
Build with Gemini X Prize – hackathon de US$ 2 mi do Google e X Prize
Fountain Life – empresa de saúde preventiva
Dr. Don Musalem – CMO da Fountain Life
Moonshots – podcast de Peter Diamandis
Salim Ismail – autor de 'Organizações Exponenciais'
Dave (DB2) – investidor em IA
Alex (AWG) – analista de IA