VIDEO: Instinct MI100 GPU probija 10 teraflopsa

  • Objavljeno u Novosti
image

AMD je danas predstavio 7nm Instinct MI100 GPU, koji donosi do 11,5 TFLOPS-a najveće propusnosti u FP64, što ga čini prvim GPU-om koji je razbio 10 TFLOPS-a u FP64 i označava 3X poboljšanje u odnosu na prethodnu generaciju MI50. Također se može pohvaliti najvećom propusnošću od 23,1 TFLOPS u FP32 radnim opterećenjima, čime pobjeđuje Nvidijin zvjerski A100 GPU u obje kategorije.

Kao što se očekivalo od GPU-a za podatkovne centre, PCIe 4.0 kartica dizajnirana je za AI i HPC radna opterećenja, a također podržava AMD-ovu drugu generaciju Infinity Fabric, koja udvostručuje I / O propusnost peer-to-peer (P2P) između kartica. Instinct MI100 također podržava AMD-ovu novu tehnologiju Matrix Core koja poboljšava performanse u operacijama matrice s jednom i mješovitom preciznošću, poput FP32, FP16, bFloat 16, INT8 i INT4. Ta tehnologija poboljšava FP32 performanse do 46,1 TFLOPS, kao što možete vidjeti u ovom videu.

Kartice dolaze s 32 GB HBM2 memorije, raspoređene u četiri "stacka", što omogućuje propusnost do 1,23 TB / s. AMD tvrdi da kartice nude do 1,8x do 2,1X više vrhunskih performansi po dolaru vrijednosti u usporedbi s Nvidijinim A100 GPU-ima.

AMD je također objavio da njegov softver za razvojne programere ROCm 4.0 sada ima kompajler otvorenog koda i objedinjenu podršku za OpenMP 5.0, HIP, PyTorch i Tensorflow.

Kartica ima TDP od 300 W i dolazi u standardnom faktoru oblika PCIe Add-In Card (AIC) s dva osmopinska konektora za napajanje. S obzirom da je fokusirana na podatkovne centre, kartici nedostaju izlazi za zaslone, a pasivno hlađena kartica ima stražnji U / I shield s velikom mrežicom za učinkovit protok zraka.

AMD je smanjio najviši takt MI100 na 1.502 MHz s 1.725 ​​MHz u odnosu na prethodni MI50, ali je udvostručio broj računalnih jedinica na 120. Tvrtka je također poboljšala propusnost memorije na 1,23 TB / s. Neto učinak poboljšanja CDNA arhitekture donosi 1,74X u vršnoj FP64 i FP32 propusnosti i nevjerojatnih 3,46X poboljšanja u matrici FP32 i 6,97X u FP16, oboje zahvaljujući AMD-ovoj novoj Matrix Core tehnologiji koja poboljšava CU-ove novim Matrix Core engineima optimiziranim za mješovite tipove podataka.

Prve OEM sustave opremljene Instinct MI100 GPU-ima isporučivat će Dell, Gigabyte, HPE i Lenovo krajem ove godine.

Podijeli