A AMD anunciou o Instinct MI100 baseado na nova arquitetura CDNA voltada para a aprendizagem de máquinas (ML) e cargas de trabalho de computação de alto desempenho (HPC). O MI100 deverá oferecer 10 teraflops de desempenho FP64 que vai até 11,5 TFLOPS quando emparelhado com processadores AMD EPYC de segunda geração.
Durante a apresentação, a AMD também confirmou que os processadores EPYC de 3º geração baseados no código Zen 3 de Milão estão agora sendo amostrados para selecionar OEMs e estão programados para um lançamento no 1º trimestre de 2021.
A AMD disse que está desenvolvendo arquiteturas diferentes adaptadas para aplicações específicas com algumas sobreposições. Enquanto a RDNA irá atender aos jogos, a CDNA está mais focada em aplicações computacionais e HPC. O Instinct MI100 oferece uma Tecnologia Matrix Core que permite operações de matriz de precisão única e mista, como FP32, FP16, bFloat16, Int8, e Int4.
O segundo gen Infinity Fabric no MI100 apresenta 32 GB de memória HBM2 a 1,2 GHz fornecendo 1,23 TB/s de largura de banda
A tabela a seguir ilustra as especificações do Instinto AMD MI100
| Projeto | Altura total, Dupla ranhura, 10,5 pol. de comprimento | 
| Unidades de cálculo | 120 | 
| Processadores Stream | 7,680 | 
| FP64 TFLOPs (Pico) | 11.5 | 
| FP32 TFLOPs (Pico) | 23.1 | 
| FP32 Matrix TFLOPs (Pico) | 46.1 | 
| FP16/FP16 Matrix TFLOPs (Pico) | 184.6 | 
| TOPS Int4/Int8 (Pico) | 184.6 | 
| bFLOAT16 TFLOPs (Pico) | 92.3 | 
| Memória HBM2 ECC | 32 GB | 
| Interface de memória | 4.096 bits | 
| Relógio de Memória | 1.2 GHz | 
| Largura de banda de memória | 1.23 TB/s | 
| Suporte PCIe | Gen4 | 
| Infinity Fabric Links/Bandwidth | 3 / 276 GB/s | 
| TDP | 300 W | 
| Refrigeração | Refrigerados passivamente | 
Enquanto o MI100 é projetado para funcionar bem com processadores EPYC, a AMD confirmou que a nova GPU também suporta processadores Intel. Em geral, pode-se esperar um desempenho de até 7x FP16 do MI100 em comparação com as GPUs AMD HPC da geração anterior.
O Instinct MI100 fornece até 64 GB/s de largura de banda Infinity Fabric entre a CPU e a GPU sem a necessidade de usar qualquer chave PCIe. Há um total de três links Infinity Fabric que oferecem até 276 GB/s de capacidade de transmissão. Essencialmente, uma colmeia quad-GPU do MI100 pode render até 1,1 TB/s de largura de banda total. De acordo com a AMD, estas características dão ao MI100 uma vantagem significativa sobre o NVIDIA A100 em cargas FP16/FP32 e, ao mesmo tempo, oferecem um desempenho superior por dólar (ver slides abaixo).
O Instinct MI100 suporta o novo ecossistema ROCm 4.0, o qual a AMD se destaca como uma solução completa para cargas de trabalho ML e HPC. ROCm 4.0 agora usa um compilador de código aberto e suporta OpenMP 5.0 e HIP. Além disso, PyTorch e TensorFlow estão agora otimizados para ROCm 4.0.
O AMD Instinct MI100 pode ser esperado no final deste ano nos principais sistemas OEM e ODM de empresas como Dell, Gigabyte, HP e SuperMicro.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais 
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros
Aqui estão alguns dos slides do briefing de imprensa da AMD
Fonte(s)
Comunicado de imprensa da AMD
































