Blackwell je nova Nvidijina AI platforma
- Objavljeno u Novosti
Nvidia je objavila dolazak platforme Blackwell, koja omogućuje izgradnju i pokretanje generativne umjetne inteligencije u stvarnom vremenu na velikim jezičnim modelima s bilijunima parametara uz do 25 puta manju cijenu i potrošnju energije od svojeg prethodnika.
Zahvaljujući procesorima H100, koje danas koristi gotovo svaka AI tvrtka na svijetu za obuku velikih jezičnih modela koji pokreću usluge poput ChatGPT-a, učinili su Nvidiju jednom od najvrjednijih tvrtki na svijetu, a sada dolazi nova generacija, koja će umjetnoj inteligenciji pružiti nove iskorake.
Nvidia kaže da Blackwell GPU arhitektura sadrži šest transformativnih tehnologija za ubrzano računalstvo, koje će pomoći u otključavanju otkrića u obradi podataka, inženjerskoj simulaciji, automatizaciji elektroničkog dizajna, računalno potpomognutom dizajnu lijekova, kvantnom računalstvu i generativnoj umjetnoj inteligenciji.
Među brojnim organizacijama i tvrtkama za koje se očekuje da će usvojiti Blackwell su Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla i xAI.
Nova arhitektura je nazvana u čast Davida Harolda Blackwella, matematičara koji se specijalizirao za teoriju igara i statistiku te prvog tamnoputog učenjaka primljenog u Nacionalnu akademiju znanosti i nasljeđuje arhitekturu Hopper, lansiranu prije dvije godine.
Blackwellovih šest revolucionarnih tehnologija, koje zajedno omogućuju obuku umjetne inteligencije i LLM zaključivanje u stvarnom vremenu za modele koji skaliraju do 10 trilijuna parametara, uključuju:
Najmoćniji čip na svijetu: Opremljen s 208 milijardi tranzistora, proizveden korištenjem posebno izrađenog 4NP TSMC procesa i povezivanjem dva čipa od 10 TB/sekundi u jedan jedinstveni GPU.
Transformer Engine druge generacije: Potaknut novom podrškom za skaliranje mikro-tenzora i NVIDIA naprednim algoritmima za upravljanje dinamičkim rasponom integriranim u okvire NVIDIA Tensor-LLM i NeMo Megatron, Blackwell će podržati dvostruko veće veličine izračuna i modela s novom 4-bitnom umjetnom inteligencijom s pomičnim zarezom sposobnosti zaključivanja.
NVLink pete generacije: Za ubrzavanje performansi za modele umjetne inteligencije s više trilijuna parametara, najnovija iteracija NVIDIA NVLink donosi revolucionarni dvosmjerni protok od 1,8 TB/s po GPU-u, osiguravajući besprijekornu komunikaciju velike brzine između do 576 GPU-a za najsloženije LLM modele.
RAS Engine: GPU-ovi koje pokreće Blackwell uključuju namjenski mehanizam za pouzdanost, dostupnost i mogućnost servisiranja. Osim toga, arhitektura Blackwell dodaje mogućnosti na razini čipa za korištenje preventivnog održavanja temeljenog na umjetnoj inteligenciji za pokretanje dijagnostike i predviđanje problema s pouzdanošću. Ovo maksimizira vrijeme neprekidnog rada sustava i poboljšava otpornost za masovne implementacije AI-a kako bi radile bez prekida tjednima ili čak mjesecima i smanjile operativne troškove.
Sigurna umjetna inteligencija: Napredne sigurnosne mogućnosti štite modele umjetne inteligencije i korisničke podatke bez ugrožavanja performansi, uz podršku za nove izvorne protokole za šifriranje sučelja, koji su ključni za industrije osjetljive na privatnost kao što su zdravstvene i financijske usluge.
Engine za dekompresiju: Namjenski mehanizam za dekompresiju podržava najnovije formate, ubrzavajući upite baze podataka kako bi pružio najviše performanse u analizi podataka i znanosti o podacima. U nadolazećim godinama obrada podataka, na koju tvrtke troše desetke milijardi dolara godišnje, bit će sve više GPU-ubrzana.
Nvidia GB200 Grace Blackwell Superčip povezuje dva Nvidia B200 Tensor Core GPU-a s Nvidi Grace CPU-om preko 900GB/s NVLink međukonekcije ultra male snage.
Za najviše performanse umjetne inteligencije, sustavi koje pokreće GB200 mogu se povezati s NVIDIA Quantum-X800 InfiniBand i Spectrum-X800 Ethernet platformama, također najavljenim danas, koje pružaju napredno umrežavanje pri brzinama do 800Gb/s.
GB200 je ključna komponenta NVIDIA GB200 NVL72, sustava s više čvorova, tekućinom hlađenog, rack-scale sustava za radna opterećenja koja zahtijevaju najviše računala. Kombinira 36 Grace Blackwell Superchipova, koji uključuju 72 Blackwell GPU-a i 36 Grace CPU-a međusobno povezanih NVLinkom pete generacije.
GB200 NVL72 pruža do 30x povećanje performansi u usporedbi s istim brojem NvidiaH100 Tensor Core GPU-ova za radna opterećenja zaključivanja LLM-a i smanjuje troškove i potrošnju energije do 25x.
Platforma djeluje kao jedan GPU s 1,4 exaflopsa AI performansi i 30 TB brze memorije, te je građevni blok za najnoviji DGX SuperPOD.
NVIDIA nudi HGX B200, poslužiteljsku ploču koja povezuje osam B200 GPU-ova putem NVLinka za podršku generativnih AI platformi temeljenih na x86. HGX B200 podržava mrežne brzine do 400 Gb/s putem NVIDIA Quantum-2 InfiniBand i Spectrum-X Ethernet mrežnih platformi.
Zasad još nije poznato koja će tvrtka ili organizacija prva nadograditi svoje „AI servere“ Nvidijinim Blackwellom, ali je za očekivati da će to učiniti svi veliki igrači.