VIDEO: AI izolira pojedinačne glasove u gužvi

  • Objavljeno u Novosti
image

Ljudi su prilično uspješni kada u gužvi (recimo u bučnoj birtiji u kojoj svi pričaju uglas) žele izolirati glas određenog sugovornika. U tim situacijama služimo se kombinacijom slušanja, odnosno prepoznavanja zvuka određenog glasa i gledanja mimike lica, odnosno "čitanja s usana".

Računala s time imaju velikih problema, pa je Google stoga posegao za AI sustavom dubokog učenja koji funkcionira na prilično sličan način kao ljudi. Googleovi znanstvenici su uvježbavali neuralnu mrežu kako bi prepoznavala pojedine ljude dok govore sami, a potom su dodali virtualnu gužvu koja uključuje i pozadinsku buku, kako bi naučili AI izolirati višestruke glasove u zasebne audio kanale. Kako bi računalu bilo lakše, pri tome se koristio video sustav prepoznavanja lica.

Na kraju su dobili učinkoviti AI sustav koji može izolirati pojedinačne glasove čak i kada govore istovremeno i nadmeću se poput stand-up komičara koje možete vidjeti u ovom videu.  

Google vjeruje kako će ovaj AI biti vrlo koristan za različite chat servise poput Hangoutsa i Dua, jer će vam omogućiti da razumijete što netko priča u prostoriji punoj ljudi, na koncertu, stadionu i drugim mjestima s velikom količinom brbljavaca. Ovo se dakako može koristiti lijepo i za prisluškivanje i uhođenje ljudi, pa vjerujemo da će biti puno zainteresiranih klijenata. 

Podijeli