Googleovo prepoznavanje govora radi offline

  • Objavljeno u Novosti
image

Googleov AI tim na svojem je blogu objavio kako je nadogradio prepoznavanje govora u Gboard tipkovnici značajkom koja omogućuje prepoznavanje po sistemu jednog po jednog slova onako kako su izgovorena, a to sada radi direktno na pametnom telefonu bez potrebe za online servisom u oblaku.

Google kaže da je htio napraviti prepoznavanje govora koje će biti dovoljno kompaktno da može raditi direktno na telefonu, kako korisnici ne bi više morali ovisiti o često nepouzdanim ili nedostupnim Wi-Fi ili mobilnim mrežama.

Prepoznavanje govora obično radi "razbijanjem" izgovorenih riječi u manje dijelove, takozvane foneme, a softver za prepoznavanje analizira redoslijed, uzorak i kontekst fonema kako bi stvarao rečenice. To obično stvara lag jer morate čekati da softver napravi najbolju pretpostavku o onome što ste rekli. Googleovi AI stručnjaci kažu da njihov model "izbacuje jedno po jedno slovo kako govorite s praznim mjestima (razmacima između riječi) na pravim mjestima".

To znači da će Gboard prepoznati svako pojedinačno slovo u riječima koje izgovorite čim ih izgovorite, umjesto da prepoznaje foneme kao drugi programi za transkripciju. 

Nova značajka zasad je dostupna samo za američki engleski jezik i radi isključivo na Pixel telefonima, no Googleov AI tim ju u budućnosti namjerava proširiti na više jezika i više uređaja.