Nova generacija AMD AI akceleratora

  • Objavljeno u Novosti
image

Kako organizacije usvajaju umjetnu inteligenciju, mnoge otkrivaju da njihova infrastruktura teško prati promjene. Pokretanje umjetne inteligencije u oblaku je opcija, ali oblak može donijeti probleme s privatnošću i nepredvidive troškove.

Nadogradnja lokalne infrastrukture je još jedna mogućnost, ali podrška velikim platformama s GPU akceleratorima može zahtijevati skupe redizajne napajanja i hlađenja podatkovnih centara.

AMD je predstavio novu generaciju AI akceleratora – Instinct MI350P PCIe GPU, namijenjen organizacijama koje žele ubrzati implementaciju umjetne inteligencije bez velikih infrastrukturnih ulaganja. U trenutku kada sve više tvrtki prelazi iz faze eksperimentiranja u produkciju, ključni izazovi ostaju isti, troškovi clouda, pitanja privatnosti i kompleksnost modernizacije podatkovnih centara.

AMD ovim lansiranjem nudi alternativu – visokoučinkovit AI hardver koji se može implementirati unutar postojeće serverske infrastrukture.

Instinct MI350P dolazi u PCIe formatu s dvostrukim utorom, dizajniran kao „drop-in“ rješenje za standardne, zračno hlađene servere. To znači da tvrtke mogu implementirati AI inference radna opterećenja bez potrebe za promjenama u napajanju, hlađenju ili rack infrastrukturi.

Ovakav pristup posebno je relevantan za organizacije koje traže ravnotežu između performansi i ulaganja – nudeći više snage od CPU rješenja, ali bez potrebe za potpunim prelaskom na specijalizirane GPU platforme.

Prema AMD-u, sustavi mogu podržati do osam GPU akceleratora, što ih čini pogodnima za male, srednje i velike AI modele, uključujući inference i RAG pipelineove.

Jedan od ključnih naglasaka ovog lansiranja je optimizacija povrata ulaganja (ROI). MI350P donosi niz tehničkih unapređenja koja izravno utječu na performanse i operativne troškove, odnosno do 4.600 TFLOPS performansi u MXFP4 preciznosti, 144 GB HBM3E memorije s propusnošću do 4 TB/s, podršku za niske preciznosti (MXFP6, MXFP4) za veći throughput i optimizaciju putem sparsity tehnologije za INT8 i BF16 formate.

Ove značajke omogućuju organizacijama učinkovitiju obradu AI radnih opterećenja uz smanjene zahtjeve za energijom i hlađenjem.

MI350P je dizajniran za rad s širokim spektrom softverskih alata i frameworka, uključujući PyTorch, Kubernetes GPU Operator i cloud-native inference servise.

Poseban naglasak stavljen je na open-source AI stack bez licencnih troškova, koji omogućuje veću transparentnost i smanjenje operativnih troškova. Postojeća radna opterećenja mogu se migrirati uz minimalne izmjene koda, čime se ubrzava prelazak u produkciju.

AMD-ov novi GPU već ima snažnu podršku ključnih partnera iz IT industrije. Tvrtke poput Dell Technologies, HPE-a, Cisca, Lenova i Supermicroa ističu kako MI350P omogućuje bržu implementaciju AI infrastrukture uz visoku razinu učinkovitosti i skalabilnosti.

Istodobno, softverski partneri poput Red Hata, VMwarea (Broadcom), Akamaija i Nutanixa naglašavaju važnost otvorene i hibridne AI arhitekture koja olakšava prijelaz iz

U eri u kojoj umjetna inteligencija postaje ključna poslovna komponenta, rješenja poput MI350P mogla bi imati važnu ulogu u ubrzavanju prijelaza s pilot-projekata na stvarne, skalabilne implementacije“, kaže AMD.

Podijeli