Umreženo 100 tisuća H200 Blackwell GPU-a za 19 dana
- Objavljeno u POP TECH
Je li Elon Musk nadčovjek? To pitanje se nalazi u naslovima brojnih članaka o osnivaču Tesle, SpaceX-a i xAI-ja, kontroverznom biznismenu i vizionaru koji nas želi natjerati da čim prije napustimo Zemlju ako želimo spasiti čovječanstvo, ali istovremeno daje potporu idejama Donalda Trumpa o "Americi samo za Amerikance".
U lipnju ove godine izašla je vijest da njegova tvrtka xAI planira izgraditi najveće superračunalo na svijetu u Memphisu, koje će se temeljiti na umreživanju superračunalnog klastera sastavljenog od 100.000 Nvidia Blackwell GPU-ova.
Planirano je da superračunalo bude najnapredniji model umjetne inteligencije ikada te da s radom započne već u prosincu ove godine, što je po šefu Nvidije Jensenu Huangu bio nemogući izazov, jer bi za povezivanje takve mreže prosječnom podatkovnom centru bilo potrebno najmanje 4 godine.
Musk i ekipa su ponovno iznenadili svijet (i Nvidiju), jer su razvili vlastitu opremu za integraciju svih komponenti u superklaster, što im je omogućilo da sve procesore umreže za samo 19 dana, u što ulazi i pokretanje XAI-jeve AI obuke na superračunalnom klasteru.
Proces je proces je također uključivao izgradnju velike tvornice u kojoj su se nalazili GPU-ovi i opremanje čitavog pogona tekućim hlađenjem i napajanjem kako bi svih 200.000 GPU-a bilo operativno.
"Integracija 100.000 GPU-ova H200 od strane Elona Muska nikad prije nije učinjena i vjerojatno je neće ponoviti druga tvrtka, barem ne još dugo vremena", izjavio je čelnik Nvidije.
Je li Musk sam vukao kabele kao što to sugerira gornja slika objavljena na X-u, nije nam poznato, ali jedva čekamo prosinac kako bismo saznali što će njegovo superračunalo biti u stanju raditi. Nadamo se da neće biti pogubno za čovječanstvo.