IBM donosi brzinu svjetlosti u generativni AI
- Objavljeno u Znanost
IBM je otkrio revolucionarno istraživanje u optičkoj tehnologiji koje bi moglo dramatično poboljšati način na koji podatkovni centri treniraju i pokreću generativne AI modele.
Istraživači su uveli novi proces za optiku u paketu (CPO), sljedeću generaciju optičke tehnologije, kako bi omogućili povezivanje unutar podatkovnih centara brzinom svjetlosti kroz optiku koja nadopunjuje postojeće žice kratkog dometa.
Dizajniranjem i sastavljanjem prvog javno objavljenog uspješnog polimernog optičkog valovoda (PWG) za napajanje ove tehnologije, IBM-ovi istraživači su pokazali kako će CPO redefinirati način na koji računalna industrija prenosi podatke velike propusnosti između čipova, tiskanih ploča i poslužitelja.
Današnja tehnologija optičkih vlakana prenosi podatke velikim brzinama na velike udaljenosti, upravljajući gotovo svim svjetskim trgovačkim i komunikacijskim prometom svjetlom umjesto električnom energijom.
Iako podatkovni centri koriste optička vlakna za svoje vanjske komunikacijske mreže, ormari u podatkovnim centrima još uvijek pretežno vode komunikaciju putem žica na bazi bakra. Ove žice povezuju GPU akceleratore koji mogu provesti više od polovice svog vremena u mirovanju, čekajući podatke s drugih uređaja u velikom, distribuiranom procesu obuke koji može izazvati značajne troškove i energiju.
IBM-ovi istraživači pokazali su način na koji se brzina i kapacitet optike mogu uvesti u podatkovne centre. U tehničkom dokumentu, IBM predstavlja novi CPO prototip modula koji može omogućiti optičko povezivanje velike brzine. Ova bi tehnologija mogla značajno povećati propusnost komunikacija podatkovnog centra, minimizirajući zastoj GPU-a uz drastično ubrzanje AI obrade.
Time bi se mogli osigurati niži troškovi za skaliranje generativne umjetne inteligencije kroz više od 5 puta smanjenje potrošnje energije u usporedbi s postojećim interkonekcijama srednjeg dometa, uz produljenje duljine interkonekcijskih kabela podatkovnog centra s jednog na stotine metara.
Nadalje, to bi dovelo i do brže obuke modela umjetne inteligencije, omogućuje programerima da obučavaju LLM-ove do pet puta brže s CPO sustavom nego s konvencionalnim ožičenjem. CPO bi mogao smanjiti vrijeme potrebno za obuku standardnog LLM-a s tri mjeseca na tri tjedna, uz povećanje performansi korištenjem većih modela i više GPU-a.
Dramatično povećana energetska učinkovitost za podatkovne centre, štedjeti će energiju ekvivalentnu godišnjoj potrošnji energije 5000 domova u SAD-u po obučenom AI modelu., navodi IBM.
"Kako generativna umjetna inteligencija zahtijeva više energije i procesorske snage, podatkovni centar mora evoluirati, a skupna optika može ove podatkovne centre učiniti spremnima za budućnost," rekao je Dario Gil, viši potpredsjednik i direktor istraživanja u IBM-u. "S ovim otkrićem, čipovi sutrašnjice komunicirat će slično kao što optički kabeli prenose podatke u podatkovne centre i iz njih, otvarajući novu eru bržih, održivijih komunikacija koje mogu podnijeti radna opterećenja AI budućnosti."