A Nvidia anunciou sua arquitetura computacional Rubin AI de última geração que finalmente corresponderá à estratégia de IA da China para executar a inferência de IA a custos muito mais baixos do que a atual edição Blackwell.
Assim como a arquitetura Nvidia Rubin AI, a plataforma é construída em torno de seis subsistemas de processamento trabalhando juntos: a CPU Vera, a nova GPU Nvidia Rubin, o switch NVLink 6 de terceira geração, a ConnectX-9 SuperNIC, a DPU BlueField-4 e o switch Ethernet Spectrum-6. Os chips são construídos em nós avançados de fundição da TSMC e apresentam otimizações de interface que visam a uma redução drástica dos custos de token e da duração do treinamento.
De fato, o "codesign" da Nvidia nos seis novos chips permite o treinamento de modelos com um quarto das GPUs necessárias na atual plataforma Nvidia Blackwell e reduz os custos por token em dez vezes. Uma redução de dez vezes nos custos de token é o que Elon Musk está prometendo para a próxima geração da Tesla, a AI5 da Tesla também; só que ele não entrará em produção em massa antes do próximo ano. Elon Musk elogiou a Nvidia Rubin como o "motor de foguete para IA" que permitirá a implantação de modelos de ponta em escala.
A China também se orgulha do baixo Preço do token de IA que consegue com modelos de código aberto como o DeepSeek e encadeando várias GPUs de IA de médio porte, como a Huawei 910C portanto, a arquitetura Rubin da Nvidia finalmente faz algo para abordar não apenas o desempenho, mas também os custos de execução dos modelos de IA.
Talvez a parte mais interessante da plataforma Rubin seja a nova CPU Nvidia Vera,"projetada para movimentação de dados e raciocínio agêntico em sistemas acelerados, com suporte total à computação confidencial" Ela pode ser emparelhada com uma GPU da Nvidia ou funcionar como um processador autônomo executando"cargas de trabalho de análise, nuvem, orquestração, armazenamento e computação de alto desempenho (HPC)" com total compatibilidade com Arm.
As especificações da CPU Vera incluem 88 núcleos personalizados e 1,2 TB/s de largura de banda de memória LPDDR5X e apresentam um consumo de energia muito econômico. A integração da interface de conectividade NVLink-C2C executa o acesso sincronizado à memória CPU-GPU como parte dos recursos de otimização que tornam a plataforma Rubin uma ordem de magnitude mais eficiente do que sua antecessora baseada em Blackwell.
Obtenha o supercomputador pessoal de IA Nvidia DGX Spark na Amazon
Fonte(s)
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros






