Microsoft predstavio svoj najnoviji AI akcelerator

  • Objavljeno u Novosti
image

Microsoft je predstavio Maia 200 akcelerator, osmišljen za dramatično poboljšanje ekonomičnosti generiranja AI tokena. Akcelerator je izgrađen na TSMC-ovom 3nm procesu s izvornim FP8/FP4 tenzorskim jezgrama, redizajniranim memorijskim sustavom s 216 GB HBM3e pri 7 TB/s i 272 MB SRAM-a na čipu, plus mehanizmima za premještanje podataka koji osiguravaju brzo i visoko iskorišteno napajanje masivnih modela.

To, prema Microsoftu, čini Maia 200 najučinkovitijim, prvorazrednim silicijem od bilo kojeg hiperskalera, s tri puta boljim FP4 performansama od treće generacije Amazon Trainiuma i FP8 performansama iznad Googleovog TPU-a sedme generacije. Također tvrde da je Maia 200 najučinkovitiji sustav inferencije koji je Microsoft ikada implementirao, s 30% boljim performansama po dolaru od hardvera najnovije generacije.

Maia 200 će se koristiti u više modela, uključujući najnovije GPT-5.2 modele tvrtke OpenAI, donoseći prednost u omjeru performansi i uloženog novca za Microsoft Foundry i Microsoft 365 Copilot.

Microsoftov tim za superintelektualnu inteligenciju koristit će Maiu 200 za generiranje sintetičkih podataka i učenje s pojačanjem kako bi poboljšao interne modele sljedeće generacije.

Svaki Maia 200 čip sadrži preko 140 milijardi tranzistora i prilagođen je velikim AI opterećenjima, a istovremeno pruža učinkovite performanse za uloženi novac. Također, svaki Maia 200 čip isporučuje preko 10 petaFLOPS-a u 4-bitnoj preciznosti (FP4) i preko 5 petaFLOPS-a u 8-bitnoj (FP8) performansi, sve unutar 750W SoC TDP-a. U praktičnom smislu, Maia 200 može bez napora pokretati današnje najveće modele, s puno prostora za još veće modele u budućnosti.

"Naš Maia AI akcelerator program osmišljen je da bude višegeneracijski. Dok implementiramo Maia 200 na našoj globalnoj infrastrukturi, već dizajniramo za buduće generacije i očekujemo da će svaka generacija kontinuirano postavljati nove standarde za ono što je moguće i pružati sve bolje performanse i učinkovitost za najvažnija AI radna opterećenja", navodi Microsoft u svojem priopćenju.

Podijeli