Notebookcheck Logo

CheckMag | A derrota da Intel para a AMD na Supercomputing 2023 foi maior do que meio milhão de Ryzen 9s - literalmente

O Aurora finalmente fez sua estreia neste verão, com cerca de meia década - duas gerações de gráficos da Nvidia ou seis lançamentos do Call of Duty - de atraso. (Imagem: Argonne National Laboratory)
O Aurora finalmente fez sua estreia neste verão, com cerca de meia década - duas gerações de gráficos da Nvidia ou seis lançamentos do Call of Duty - de atraso. (Imagem: Argonne National Laboratory)
Os quadros de jogos podem ser o centro das atenções e do entusiasmo na Internet, mas quando o mundo empresarial tem muito mais dinheiro para gastar, o mundo das interconexões e dos aceleradores é muito mais importante.
Opinion by Matthew Lee
Views, thoughts, and opinions expressed in the text belong solely to the author.

Na conferência Supercomputing 2023, realizada em novembro, a lista atualizada Top500 dos supercomputadores mais poderosos do mundo revelou que o sistema Aurora da Intel - originalmente planejado para chegar até 2018 - não conseguiu superar a máquina Frontier da AMD. O Aurora, instalado no Argonne National Laboratory, alcançou uma pontuação de 585,34 PetaFLOPS no benchmark LINPACK (HPL) de alto desempenho, enquanto o Frontier, residente no Oak Ridge National Laboratory do Tennessee, manteve sua liderança com uma pontuação HPL de 1.194 PFLOPS. Qualquer um desses números supera em muito o resultado de <1 TeraFLOP obtido pelo Ryzen 9 7950X nos testes de HPL do site Puget Systems (embora o último seja muito mais acessível para compra na Amazon!)

Agora, é claro, há muitos asteriscos a serem acrescentados aqui. O Aurora só foi instalado no final de junho e, desde então, vem sendo submetido a testes de ajuste e estabilidade; o resultado, de certa forma, pouco animador apresentado ao Top500 foi com apenas metade da máquina em operação. Grande parte do período de atraso se deveu a deslizes dos parceiros, e não da própria Intel. Os atrasos não foram apenas mudanças estáticas de cronograma para o mesmo hardware, e gerações mais avançadas de chips da Intel foram implementadas no produto final do que o previsto originalmente. A lista continua.

Mas a questão é a seguinte: é uma lista com a qual muitas pessoas que estão assistindo a tudo isso provavelmente não se importam .

A Frontier está no topo da tabela desde que ultrapassou a Fugaku - e passou a barreira de 1-ExaFLOP - em maio de 2022. (Imagem: Top500)
A Frontier está no topo da tabela desde que ultrapassou a Fugaku - e passou a barreira de 1-ExaFLOP - em maio de 2022. (Imagem: Top500)

A execução é fundamental para os clientes comerciais. Se um contrato de nível de serviço exige um tempo de atividade de cinco noves, esse 99,999% não tem espaço para muitos asteriscos. E, sob essa perspectiva, a Intel - no nível mais alto, contratada por um cliente do governo (o Departamento de Energia dos EUA, nada menos que isso) - ficou em segundo lugar, derrotada por um sistema entregue um ano e meio antes, e com tanto atraso que deveria ter entrado em serviço antes mesmo de o rival ser anunciadohttps://www.notebookcheck.net/AMD-and-Cray-are-building-world-s-fastest-exascale-supercomputer.420246.0.html .

Um resultado como esse pode ter implicações significativas para o mercado empresarial, mesmo que esses sistemas pareçam uma torre de marfim separada dos racks do mundo real. Da mesma forma que o desempenho no topo da linha de gráficos para consumidores concedeu à Nvidia uma mentalidade inatacável entre os entusiastas de hardware, a Frontier da AMD, que está no topo e defende sua posição há dezoito meses, pode ver os efeitos de halo se espalharem pela pilha de produtos até seus processadores EPYC e aceleradores Radeon Instinct. O inverso também pode acontecer, com as CPUs Xeon e os aceleradores Xe da Intel da Intel sejam prejudicados por essa derrota (e pelos problemas mais amplos do Aurora), independentemente de seus méritos.

Além disso, há a questão do uso de energia. Embora o Aurora esteja fornecendo apenas cerca de um quarto dos dois ExaFLOPs (ou seja, na região de 2.000 PetaFLOPs) anteriormente reivindicados pela Intel como meta, ele está sendo usado para aumentar a capacidade de processamento como meta da Intel, ele está consumindo quase metade da energia. Isso o coloca em 24,7 MW, o que, na verdade, é quase 2 MW a mais do que o Frontier consome e, uma vez que o senhor faz o ajuste para o último bombeamento de 1.194 ExaFLOPs, a situação de eficiência para a equipe azul é particularmente terrível.

Poderia haver algumas explicações para isso, mas nenhuma delas faz a Intel parecer boa. Talvez as tão badaladas CPUs de servidor Sapphire Rapids e GPUs Ponte Vecchio sejam terrivelmente ineficientes para começar; talvez o consumo de energia declarado inclua toda a infraestrutura e o resfriamento do supercomputador, em vez de apenas a metade que foi enviada para a lista Top500, ou a outra metade do sistema também esteja ativa e exibindo um consumo de energia ocioso desconcertantemente alto. De qualquer forma, os números principais mostram que a solução da Intel oferece menos da metade da eficiência da concorrência - e mesmo que os supercomputadores gigantes em si não sejam aplicáveis a clientes empresariais em potencial, a conta de luz certamente é.

Embora os processadores Xeon Phi "Knight's Hill" originalmente destinados ao Aurora nunca tenham se concretizado, a Intel continuou a aumentar a meta de desempenho do sistema nos anos seguintes. (Imagem: Intel)
Embora os processadores Xeon Phi "Knight's Hill" originalmente destinados ao Aurora nunca tenham se concretizado, a Intel continuou a aumentar a meta de desempenho do sistema nos anos seguintes. (Imagem: Intel)

No entanto, há apenas mais uma pergunta: quem disse que eles não se aplicam ao mundo corporativo?

Claro, as medalhas de ouro e prata foram construídas em (e para) plataformas de computação de alto desempenho sob medida, mas o sistema Eagle da Microsoft da Microsoft também subiu ao pódio. Os 561,2 PetaFLOPs de processamento de números do Eagle foram criados a partir de unidades HGX H100 mais padronizadas da Nvidia, e ele está pronto para ser usado em modelos de IA e máquinas virtuais por meio da Azure Cloud Platform; um sistema comercial feito com hardware comercial, acima de todos os sistemas de HPC sob medida do mundo, com exceção de dois.

No final das contas, o mundo da computação para o consumidor é ofuscado pela grande escala dos mercados de servidores e centros de dados. Os duelos pelo desempenho e pela eficiência em seu auge terão seus próprios efeitos - e efeitos muito mais impactantes para o resultado final de um fabricante de chips do que qualquer lista de "Melhor CPU para jogos".

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2023 12 > A derrota da Intel para a AMD na Supercomputing 2023 foi maior do que meio milhão de Ryzen 9s - literalmente
Matthew Lee, 2023-12- 9 (Update: 2023-12- 9)