Prvi ECRAM integriran u silicij za praktičan AI akcelerator
- Objavljeno u Znanost
Transformativne promjene koje donose duboko učenje i umjetna inteligencija popraćene su ogromnim troškovima. Na primjer, rad OpenAI-jevog ChatGPT algoritma košta najmanje 100.000 dolara svaki dan.
To bi se moglo smanjiti akceleratorima ili računalnim hardverom dizajniranim za učinkovito izvođenje specifičnih operacija dubokog učenja. Međutim, takav je uređaj održiv samo ako se može integrirati s glavnim računalnim hardverom temeljenim na siliciju.
To je sprječavalo implementaciju jednog vrlo obećavajućeg akceleratora dubokog učenja, Elektrokemijske memorije s izravnim pristupom, odnosno ECRAM-a, vrste trajne memorije s više razina po ćeliji dizajnirane za duboko analogno ubrzanje učenja.
Istraživački tim na Sveučilištu Illinois Urbana-Champaign sada je postigao prvu integraciju ECRAM-ova na silicijskim tranzistorima na razini materijala. Istraživači, predvođeni diplomiranim studentom Jinsong Cuijem i profesorom Qing Caom s Odsjeka za znanost i inženjerstvo materijala, nedavno su izvijestili o ECRAM uređaju dizajniranom i proizvedenom s materijalima koji se mogu nanijeti izravno na silicij tijekom izrade, čime je stvoren prvi praktični ECRAM temeljen na akceleratoru dubokog učenja.
"Drugi ECRAM uređaji napravljeni su s mnogim teško dostupnim svojstvima potrebnim za akceleratore dubokog učenja, ali naš je prvi koji je postigao sva ta svojstva i bio integriran sa silicijem bez problema s kompatibilnošću", rekao je Cao. "Ovo je bila posljednja velika prepreka širokoj upotrebi tehnologije."
ECRAM je memorijska ćelija ili uređaj koji pohranjuje podatke i koristi ih za izračune na istom fizičkom mjestu. Ova nestandardna računalna arhitektura eliminira trošak energije za prebacivanje podataka između memorije i procesora, omogućujući vrlo učinkovito izvođenje operacija s velikim brojem podataka.
ECRAM kodira informacije premještanjem mobilnih iona između vrata i kanala. Električni impulsi primijenjeni na izlazni terminal, ili ubrizgavaju ione u kanale, ili izvlače ione iz njih, a rezultirajuća promjena u električnoj vodljivosti kanala pohranjuje informacije. Zatim se očitava mjerenjem električne struje koja teče kroz kanal. Elektrolit između vrata i kanala sprječava neželjeni protok iona, omogućujući ECRAM-u da zadrži podatke kao trajnu memoriju.
Istraživački tim odabrao je materijale kompatibilne s tehnikama mikroproizvodnje silicija: volframov oksid za vrata i kanal, cirkonijev oksid za elektrolit i protone kao pokretne ione. To je omogućilo da se uređaji integriraju i kontroliraju standardnom mikroelektronikom.
Budući da je isti materijal korišten za terminale vrata i kanala, ubrizgavanje iona u kanal i izvlačenje iona iz kanala su simetrične operacije, koje pojednostavljuju upravljačku shemu i značajno povećavaju pouzdanost. Istraživači su otkrili da su njihovi uređaji izdržali više od 100 milijuna ciklusa čitanja i pisanja i da su znatno učinkovitiji od standardne memorijske tehnologije. Konačno, budući da su materijali kompatibilni s tehnikama mikrofabrikacije, uređaji bi se mogli smanjiti na mikro i nanomjere, što bi omogućilo visoku gustoću i računalnu snagu.
Istraživači su demonstrirali svoj uređaj izradom nizova ECRAM-ova na silikonskim mikročipovima za izvođenje množenja matrica, matematičke operacije ključne za duboko učenje. Unosi matrice ili težine neuronske mreže pohranjeni su u ECRAM-ovima, a niz je izvršio množenje vektorskih ulaza, predstavljenih kao primijenjene napone, korištenjem pohranjenih težina za promjenu rezultirajućih struja. Ova operacija, kao i ažuriranje težine, izvedeni su s visokom razinom paralelizma.
Istraživači patentiraju novi uređaj i surađuju s partnerima iz industrije poluvodiča kako bi ovu novu tehnologiju plasirali na tržište. Prema Caou, glavna primjena ove tehnologije je u autonomnim vozilima, koja moraju brzo učiti o okolini i donositi odluke s ograničenim računalnim resursima.