VIDEO: Tehnologija selektivnog poništavanja buke

  • Objavljeno u Znanost
image

Većina ljudi koji su koristili slušalice s tehnologijom poništavanja buke znaju da čuti pravu buku u pravo vrijeme može biti od vitalnog značaja. Netko bi možda želio obrisati automobilske sirene kada radi u zatvorenom prostoru, ali ne i kada hoda prometnim ulicama, no ljudi ne mogu birati koje će zvukove njihove slušalice poništiti.

Sada je tim predvođen istraživačima sa Sveučilišta Washington razvio algoritme dubokog učenja koji korisnicima omogućuju odabir zvukova koji se filtriraju kroz njihove slušalice u stvarnom vremenu. Sustav koji nazivaju "semantičkim sluhom" u slušalicama emitira snimljeni zvuk na povezani pametni telefon, što poništava sve zvukove iz okoline. Bilo putem glasovnih naredbi ili aplikacije za pametni telefon, korisnici slušalica mogu odabrati koje zvukove žele uključiti iz 20 klasa, kao što su sirene, dječji plač, govor, usisavači i cvrkut ptica. Kroz slušalice će se reproducirati samo odabrani zvukovi.

"Razumijevanje kako ptica zvuči i izdvajanje njezinog zvuka iz svih drugih zvukova u okruženju zahtijeva inteligenciju u stvarnom vremenu koju današnje slušalice za poništavanje buke nisu postigle", rekao je stariji autor Shyam Gollakota, profesor Sveučilišta Paul G. Allen u školi Računalne znanosti i inženjerstvo. "Izazov je u tome što zvukovi koji čuju nositelji slušalica moraju biti usklađeni s njihovim vizualnim osjetilima. Ne možete čuti nečiji glas dvije sekunde nakon što razgovara s vama. To znači da neuronski algoritmi moraju obraditi zvukove ispod stotinke sekunde."

Zbog toga semantički slušni sustav mora obrađivati ​​zvukove na uređaju kao što je povezani pametni telefon, umjesto na robusnijim poslužiteljima u oblaku. Dodatno, budući da zvukovi iz različitih smjerova dolaze u uši ljudi u različito vrijeme, sustav mora sačuvati ove odgode i druge prostorne znakove kako bi ljudi i dalje mogli smisleno percipirati zvukove u svojoj okolini.

Testiran u okruženjima kao što su uredi, ulice i parkovi, sustav je mogao izdvojiti sirene, cvrkut ptica, alarme i druge ciljne zvukove, dok je uklanjao svu ostalu buku iz stvarnog svijeta, kao što možete vidjeti u ovom videu.

Kada su 22 sudionika ocijenila audio izlaz sustava za ciljni zvuk, rekli su da se kvaliteta u prosjeku poboljšala u usporedbi s izvornom snimkom.

U nekim slučajevima sustav se borio razlikovati zvukove koji dijele mnoga svojstva, poput vokalne glazbe i ljudskog govora. Istraživači napominju da bi uvježbavanje modela na više podataka iz stvarnog svijeta moglo poboljšati ove rezultate.

Podijeli