Google Cloud Next '26: a era dos agentes

O Google Cloud Next '26 encerrou em Las Vegas com 260 anúncios em três dias e mais de 32 mil participantes presenciais. O recado central foi explícito: a próxima década do enterprise não será definida pela quantidade de modelos, e sim pela infraestrutura capaz de operar exércitos de agentes de IA em produção. Para quem desenha arquitetura corporativa, o evento foi menos sobre IA generativa e mais sobre o plano de controle que vai sustentar essa nova carga.

A era agêntica tem nome e plataforma

A Gemini Enterprise Agent Platform é o produto que organiza toda a tese. Pensada como um mission control para frotas de agentes, ela empilha um Agent Development Kit baseado em grafos, Agent Runtime com cold start abaixo de um segundo, Agent Studio em low-code, Agent Sandbox para execução segura de código gerado por modelos, Memory Bank de longo prazo, Agent Identity criptográfica, Agent Registry de ferramentas aprovadas e Agent Gateway com Model Armor. A camada de operação inclui Anomaly Detection em tempo real, Security Dashboard via Security Command Center, Agent Simulation com usuários sintéticos e Agent Optimizer para refinar instruções automaticamente.

O Agent Marketplace estreou com mais de 70 agentes pré-construídos por parceiros como Adobe, Atlassian, Deloitte, Oracle, Palo Alto Networks, Salesforce, ServiceNow e Workday. A leitura é direta: os fluxos corporativos passam a ser compostos a partir de blocos prontos, não escritos do zero em cada projeto.

Infraestrutura sob a IA: TPUs 8t e 8i

A oitava geração de TPUs marcou o reposicionamento do Google na disputa pelo silício de IA. O TPU 8t é voltado a treinamento e escala até 9.600 chips por pod, com cerca de três vezes o poder computacional da geração anterior Ironwood. O TPU 8i é dedicado a inferência e aprendizado por reforço, conectando 1.152 chips em um único pod, com SRAM on-chip triplicada e ganho de 80% em performance por dólar.

No Compute Engine, surgiram a família A5X com GPUs NVIDIA Vera Rubin NVL72 prevista para o final de 2026, a Axion N4A baseada em Arm com o dobro da eficiência e instâncias de armazenamento Z4D e Z4M com até 168 TiB de SSD local. Em paralelo, Hyperdisk ML chegou a 2 TiB/s, Rapid Bucket entrega mais de 15 TB/s e o Managed Lustre atinge 10 TB/s — números que só fazem sentido para quem alimenta clusters de inferência em escala industrial.

Multi-cloud deixa de ser slogan

A novidade mais consequente para arquitetura corporativa talvez seja a confirmação do acordo de multi-cloud networking entre Google e AWS, com integração ao Azure prevista ainda para 2026. No nível dos dados, o BigLake foi rebatizado de Cross-Cloud Lakehouse e ganhou federação zero-copy sobre AWS e Azure via Iceberg REST Catalog, com integração nativa a AWS Glue, Databricks, Snowflake e SAP.

O Spanner Omni levou o banco globalmente consistente da Google para outras nuvens e o novo Spanner Columnar Engine promete queries até duzentas vezes mais rápidas. Cross-cloud caching guarda dados de AWS e Azure após a primeira leitura para reduzir custos de egress e acelerar consultas seguintes. Na prática, o desenho de cloud-of-record somada à cloud-of-AI deixa de exigir pipelines pesados de replicação.

Cloud Run amplia escopo e GKE entra nos hyperclusters

O Cloud Run continuou se aproximando do território das aplicações tradicionais. Worker pools chegaram em GA para cargas pull-based, instâncias longas entraram em preview, GPUs NVIDIA RTX PRO 6000 ficaram disponíveis e até acesso SSH foi liberado para depuração. No outro lado do espectro, o GKE Hypercluster, com escala de milhões de aceleradores, atingiu GA privada, junto a um RL Scheduler experimental, predictive latency boost com queda de 70% na latência p95 e auto KV cache tiering para inferência.

Tempos de startup de pod caíram 80%, de nó 75%, e o carregamento de modelos ficou cinco vezes mais rápido. São métricas que reabrem decisões antigas sobre warm pools, canários e estratégias de cold start em ambientes regulados.

Segurança agêntica: Wiz vira parte do tecido

Com a aquisição da Wiz concluída, o Google materializou a Wiz AI Application Protection Platform cobrindo código, nuvem, runtime, multi-cloud e workloads de IA. O Model Armor passou a ser integrado nativamente ao Agent Gateway, Agent Runtime, Firebase e LangChain, com proteção contra prompt injection, tool poisoning e vazamento de dados.

Cloud Armor Managed Rules em parceria com a Thales, Confidential VMs C4 com Intel TDX e G4 com NVIDIA, e chaves PQC quantum-safe entraram em preview. A leitura é direta: a superfície de ataque migrou para o agente, e a defesa precisa seguir o mesmo caminho.

O que muda na sua arquitetura corporativa

O Next '26 deixou três frentes claras para quem desenha arquitetura. Primeiro, agentes deixaram de ser um experimento isolado em uma equipe e passaram a exigir governança, identidade, registry e observabilidade próprios. Segundo, a federação zero-copy enfraquece a justificativa de mover dados em massa entre nuvens — o que muda o desenho de pipelines, custos de egress e separação de domínios de dados. Terceiro, a infraestrutura para IA virou requisito não-funcional de primeira ordem, com escolhas concretas sobre TPU, GPU, storage de altíssima banda e schedulers especializados.