Notebookcheck Logo

A plataforma de IA Rubin da Nvidia reduz em dez vezes os custos de tokens em comparação com a Blackwell, enquanto Elon Musk a elogia como "motor de foguete para IA

Plataforma de IA Rubin da Nvidia (Fonte da imagem: Nvidia)
Plataforma de IA Rubin da Nvidia (Fonte da imagem: Nvidia)
A afirmação da Tesla de que seu futuro chip AI5 executará inferência 10 vezes mais barata do que a arquitetura Blackwell da Nvidia teve vida curta. A plataforma Nvidia Rubin AI de última geração oferece uma redução de dez vezes nos custos por token.

A Nvidia anunciou sua arquitetura computacional Rubin AI de última geração que finalmente corresponderá à estratégia de IA da China para executar a inferência de IA a custos muito mais baixos do que a atual edição Blackwell.

Assim como a arquitetura Nvidia Rubin AI, a plataforma é construída em torno de seis subsistemas de processamento trabalhando juntos: a CPU Vera, a nova GPU Nvidia Rubin, o switch NVLink 6 de terceira geração, a ConnectX-9 SuperNIC, a DPU BlueField-4 e o switch Ethernet Spectrum-6. Os chips são construídos em nós avançados de fundição da TSMC e apresentam otimizações de interface que visam a uma redução drástica dos custos de token e da duração do treinamento.

De fato, o "codesign" da Nvidia nos seis novos chips permite o treinamento de modelos com um quarto das GPUs necessárias na atual plataforma Nvidia Blackwell e reduz os custos por token em dez vezes. Uma redução de dez vezes nos custos de token é o que Elon Musk está prometendo para a próxima geração da Tesla, a AI5 da Tesla também; só que ele não entrará em produção em massa antes do próximo ano. Elon Musk elogiou a Nvidia Rubin como o "motor de foguete para IA" que permitirá a implantação de modelos de ponta em escala.

A China também se orgulha do baixo Preço do token de IA que consegue com modelos de código aberto como o DeepSeek e encadeando várias GPUs de IA de médio porte, como a Huawei 910C portanto, a arquitetura Rubin da Nvidia finalmente faz algo para abordar não apenas o desempenho, mas também os custos de execução dos modelos de IA.

Talvez a parte mais interessante da plataforma Rubin seja a nova CPU Nvidia Vera,"projetada para movimentação de dados e raciocínio agêntico em sistemas acelerados, com suporte total à computação confidencial" Ela pode ser emparelhada com uma GPU da Nvidia ou funcionar como um processador autônomo executando"cargas de trabalho de análise, nuvem, orquestração, armazenamento e computação de alto desempenho (HPC)" com total compatibilidade com Arm.

As especificações da CPU Vera incluem 88 núcleos personalizados e 1,2 TB/s de largura de banda de memória LPDDR5X e apresentam um consumo de energia muito econômico. A integração da interface de conectividade NVLink-C2C executa o acesso sincronizado à memória CPU-GPU como parte dos recursos de otimização que tornam a plataforma Rubin uma ordem de magnitude mais eficiente do que sua antecessora baseada em Blackwell.

Obtenha o supercomputador pessoal de IA Nvidia DGX Spark na Amazon

Fonte(s)

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Notícias > Arquivo de notícias 2026 01 > A plataforma de IA Rubin da Nvidia reduz em dez vezes os custos de tokens em comparação com a Blackwell, enquanto Elon Musk a elogia como "motor de foguete para IA
Daniel Zlatev, 2026-01- 6 (Update: 2026-01- 6)