Dwarkesh Patel
Alex Imas e Phil Trammell discutem como a automação total de cadeias produtivas pode reduzir a participação do trabalho na economia, mas a criação de novas variedades de bens de capital (como novos usos para computação) pode manter a demanda por trabalho. Eles destacam que a elasticidade da demanda é crucial: se a demanda por bens automatizados for elástica, o gasto total pode aumentar, mantendo a participação do trabalho. A incerteza sobre dados de elasticidade e a falta de dados sobre preferências dos consumidores são apontadas como barreiras para previsões precisas.
Sarah Paine explica que potências continentais (como Rússia e China) e marítimas (como EUA e Reino Unido) organizam o mundo de formas opostas devido à geografia. Continentais focam em defesa territorial e exércitos massivos, enquanto marítimas priorizam comércio e marinhas. A distinção central é a capacidade de se defender no mar: potências marítimas têm um 'moat' oceânico, continentais não. Isso gera implicações militares, econômicas e políticas que persistem até hoje.
Paine argumenta que Rússia e China, apesar de ambições marítimas, não possuem os pré-requisitos para um paradigma marítimo: falta-lhes um 'moat', têm muitos vizinhos hostis, infraestrutura interna deficiente (Rússia) e instituições instáveis. Ambas são potências continentais por natureza, com históricos de expansão territorial violenta e genocídios. A China, sob Xi Jinping, privilegia o setor estatal sobre o privado, afastando-se do modelo marítimo.
Eric Jang, ex-VP de IA na 1x Technologies, passou o sabático reconstruindo e melhorando o AlphaGo. Ele explica como o Monte Carlo Tree Search (MCTS) combinado com redes neurais de valor e política torna o problema do Go tratável, reduzindo o custo computacional de milhões de dólares para alguns milhares. O projeto mostra como técnicas de auto-jogo e aprendizado por reforço podem ser aplicadas a LLMs.
Reiner Pope, CEO da Matroid, explica a arquitetura de chips de IA desde o nível mais baixo (portas lógicas AND, OR, NOT) até o multiplicador-acumulador (MAC) de 4 bits, que é a operação fundamental para multiplicação de matrizes. Ele detalha como o MAC é implementado com portas AND para produtos parciais e full adders para somar os resultados, mostrando que o número de full adders escala quadraticamente com a largura de bits (P*Q). Isso explica por que precisões mais baixas (FP4) são muito mais eficientes que FP8, e por que a Nvidia passou a anunciar FP3 como 3x mais rápido que FP8, embora o esperado fosse 4x devido à complexidade extra do floating point.
Para resolver o problema do custo de comunicação, os projetistas de chips introduziram os systolic arrays (Tensor Cores), que implementam diretamente em hardware um loop de multiplicação de matrizes. Em vez de buscar cada operando individualmente de um register file, a matriz de pesos é armazenada localmente no array e reutilizada por muitos ciclos, enquanto apenas os vetores de entrada e saída são lidos/escritos. Isso reduz drasticamente a largura de banda necessária: a comunicação escala linearmente com a dimensão X, enquanto a computação escala quadraticamente (X*Y). O exemplo mostra um array 2x2, mas TPUs antigos usavam 128x128.
Imas propõe o 'setor relacional', onde bens e serviços têm valor porque um humano está envolvido (ex.: arte feita por humanos, atendimento personalizado). Experimentos mostram que pessoas pagam mais por itens feitos por humanos do que por IA, especialmente quando são únicos. No entanto, se a demanda por esses bens não crescer o suficiente, a participação do trabalho pode cair. A falta de dados sobre preferências por interação humana limita previsões sobre o tamanho desse setor.
O episódio explora o cenário em que a IA automatiza empregos de forma gradual, gerando desemprego sem expandir significativamente a fronteira tecnológica. Isso tornaria difícil redistribuir a riqueza, pois o 'bolo' não cresce. Os economistas argumentam que esse cenário é improvável, pois a automação de um emprego (ex.: engenheiro de software) geralmente permite automatizar outros, gerando economia suficiente para compensar. Além disso, a história mostra que a fronteira tecnológica sempre se expandiu com automação.
Imas afirma que, apesar do hype, não há evidências de desemprego em massa causado por IA. Dados do Budget Lab da Yale mostram que, mesmo em setores expostos como engenharia de software, o emprego continua crescendo, embora o crescimento para juniores seja um pouco menor. Ele alerta para o risco de 'narrativas de automação' levarem empresas a demitir por pressão social, mesmo sem ganhos reais de produtividade.
Paine compara mortes na Segunda Guerra Mundial: potências continentais como URSS (8,5 milhões de soldados mortos) e China (1,3 milhão) sofreram perdas muito maiores que marítimas como EUA (295 mil) e Reino Unido (326 mil). Com civis, a diferença é ainda mais gritante: mais de 25 milhões de soviéticos mortos. Isso ocorre porque as guerras continentais são travadas em território próprio, devastando populações civis, enquanto potências marítimas podem escolher quando e onde intervir.
A Revolução Industrial mudou a fonte de poder da terra para o comércio e a indústria. O transporte marítimo se tornou muito mais barato que o terrestre: contêineres reduziram custos de carga de US$ 6/ton para menos de US$ 0,20. Navios gigantes transportam mais de 21 mil contêineres, enquanto trens levam no máximo 600. A Rota da Seda chinesa (Belt and Road) enfrenta desafios de bitolas diferentes e instabilidade, tornando o transporte marítimo mais seguro e econômico.
Paine detalha a estratégia britânica para conter potências continentais como Napoleão: manter a economia doméstica crescendo, bloquear o comércio inimigo, financiar aliados continentais, lutar em teatros periféricos, evitar confronto direto com o exército principal e atacar apenas quando o inimigo estiver exausto. Essa abordagem de guerra prolongada, focada em desgaste econômico e coalizões, contrasta com a abordagem continental de batalhas decisivas.
O Go tem uma árvore de busca com aproximadamente 361^300 possibilidades, inviável para busca exaustiva. AlphaGo usa duas redes neurais: uma de valor, que estima a probabilidade de vitória a partir de um estado, e uma de política, que sugere os melhores movimentos. Isso reduz drasticamente a profundidade e a largura da busca, permitindo que o MCTS seja eficiente.
Pope mostra que, em arquiteturas tradicionais (como CUDA cores pré-Volta), o custo de mover dados do register file para a ALU é muito maior que o custo da computação em si. Usando um multiplexador de 8 entradas como exemplo, ele calcula que 7/8 da área do circuito são gastos apenas na seleção e movimentação dos operandos, e apenas 1/8 na lógica de multiplicação-acumulação. Esse gargalo motivou a criação dos Tensor Cores (systolic arrays), que aumentam a granularidade da computação, reduzindo a proporção de comunicação.
Pope observa que o mesmo princípio de maximizar a razão entre computação e comunicação aparece em todas as camadas do design de chips de IA: desde a escolha da precisão numérica (FP4 vs FP8, com escala quadrática), passando pelo tamanho do systolic array, até a frequência do clock. Esse princípio também se aplica à inferência distribuída entre múltiplos chips, discutida em episódio anterior. A ideia é sempre agrupar o máximo de operações antes de precisar mover dados, seja entre gates, entre unidades funcionais ou entre chips.
Imas e Trammell comparam mecanismos de redistribuição para lidar com a automação. O imposto de renda negativo oferece seguro imediato, mas pode gerar dependência política. O capital básico universal (distribuir ações de empresas) evita dependência, mas enfrenta problemas de indexação (quais empresas incluir). O imposto sobre consumo (como IVA) permite ao governo comprar ações e distribuí-las, mas pode distorcer investimentos. A discussão destaca a dificuldade de equilibrar eficiência e sustentabilidade política.
Imas critica o cenário da Citrine que prevê recessão com automação, argumentando que para haver crescimento negativo seria necessário que os detentores de capital tivessem demanda limitada e não investissem o excedente. Com a expansão da fronteira tecnológica, a abundância gerada tende a impulsionar o crescimento, não a recessão. O cenário só seria plausível em uma depressão, onde a tecnologia não avança, o que não é o caso com IA.
Eric Jang testou arquiteturas de rede neural para o Go e descobriu que ResNets superam Transformers em regimes de baixo orçamento computacional. Embora Transformers tenham atenção global que poderia conectar características distantes no tabuleiro, eles exigem mais dados. Para o Go, a convolução local das ResNets ainda oferece melhor custo-benefício.
Jang recomenda iniciar projetos de IA com dados supervisionados de especialistas, mesmo que o objetivo final seja auto-jogo. Treinar a rede primeiro com jogos de humanos experts para prever movimentos e resultados fornece uma inicialização forte, facilitando a convergência. Essa abordagem pragmática evita começar do zero e acelera o desenvolvimento.
Pope explica o papel do clock cycle na sincronização de chips massivamente paralelos. O clock global força todos os circuitos a avançarem em lockstep a cada nanossegundo. Para aumentar a frequência, os projetistas inserem registros de pipeline entre blocos de lógica, mas isso custa área e pode quebrar loops de realimentação (como acumuladores). O trade-off é que uma frequência muito alta leva a uma área dominada por registros, reduzindo a eficiência real (throughput = operações por ciclo × ciclos por segundo). A escolha da frequência é uma decisão de arquitetura que equilibra latência, área e throughput.
Embora o Go seja um jogo de informação perfeita, onde o estado atual basta para a estratégia ótima, jogos como pôquer ou Diplomacia exigem considerar o histórico de ações. Jang sugere que variações como Go 2v2, onde é preciso modelar o comportamento do parceiro, são áreas promissoras para pesquisa em auto-jogo e aprendizado por reforço.