Hrvatski AI za grupiranje podataka i prepoznavanje lica

  • Objavljeno u Znanost
image

Jedan od temeljnih problema u računalnim znanostima unutar područja poznatog kao nenadzirano učenje jest grupiranje podataka. Naime, za razliku od nadziranog strojnog učenja gdje su podaci dani u obliku ulazne i ciljne vrijednosti, a stroj uči funkciju koja ulaznim podacima pridružuje klasnu ili realnu vrijednost ciljanih podataka, u procesu nenadziranog strojnog učenja od algoritama se očekuje da podatke grupiraju u funkcionalne skupine koristeći isključivo informacije naučene iz samih podataka (engl. data driven methods). Pojednostavljeno, kod nenadziranog učenja nema učitelja, nema onoga koji pokazuje točno znanje, dani su podaci bez ciljne vrijednosti. U ovom slučaju cilj je grupirati primjere i otkriti neku strukturnu pravilnost u podacima, odnosno otkriti što podaci znače.

Strojno učenje jedno je od danas najuzbudljivijih područja računarske znanosti zbog brojnih mogućnosti primjena od raspoznavanja uzoraka i dubinske analize podataka do robotike, računalnog vida, bioinformatike i računalne lingvistike sve do medicine.

Neke od najčešćih primjena grupiranja podataka u medicini odnose se na segmentaciju slike, primjerice kod CT slike (skupine su organi), PET slike (skupine su tkiva), mikroskopske slike histopatoloških preparata (skupine su tkiva i/ili stanice), slike optičke koherentne tomografije oka (npr. skupine su slojevi unutar mrežnice).

Znanstvenici Laboratorija za reprezentacije znanja i strojno učenje Zavoda za elektroniku, Maria Brbić i dr. sc. Ivica Kopriva razvili su novu metodu za grupiranje podataka temeljenih na modelu linearnih potprostora kao generatora odgovarajućih funkcionalnih skupina. Ovu novu metodu odlikuje poboljšana točnost u odnosu na postojeće metode te predstavlja fundamentalni doprinos problemu grupiranja podataka. Razvijena metoda je rezultat istraživanja doktorandice Marije Brbić u okviru istraživačkog projekta Hrvatske zaklade za znanost (HrZZ).

Da je riječ o značajnim rezultatima potvrđuje i objava rada u jednom od najutjecajnijih znanstvenih časopisa u području računalnih znanosti i umjetne inteligencije 'IEEE Transactions on Cybernetics' koji se s obzirom na visoki faktor odjeka (8.803) svrstava na treće mjesto u ovom području.

''Primjene koje smo ilustrirali u ovom novom radu odnose se na prepoznavanje lica odnosno grupiranje slika lica u skupine koje odgovaraju osobama, zatim prepoznavanje govornika, odnosno grupiranje značajki govora u skupine koje odgovaraju osobama, te prepoznavanje rukom pisanih brojeva, odnosno grupiranje slika u skupine koje odgovaraju znamenkama od 0 do 9“, objašnjava dr. sc. Ivica Kopriva.

Razvijene metode grupiranja podataka kod navedenih primjera temelje se na modelu prema kojem su podaci unutar svake skupine generirani iz pripadajućeg linearnog potprostora. Temeljem tog modela razvijeni su algoritmi koji daju vrlo kompetitivne rezultate na grupiranju zahtjevnih skupova podataka.

''Ključan element u ovom pristupu je učenje matrice reprezentacije koja je rijetka i ima nizak rang. Umjesto konveksnih mjera ranga i rijetkosti koje se standardno koriste, u radu su predložene mjere koje bolje procjenjuju rang i rijetkost: (i) egzaktne mjere temeljene na L0 i Schatten-0 kvazi normama, te (ii) glatka surogat funkcija L0 i Schatten-0 kvazi normi.'' – objašnjava Maria Brbić.

Uvođenjem ovih mjera odgovarajući optimizacijski problemi su postali nekonveksni, što dokaz konvergencije algoritma čini zahtjevnim. Unatoč ovim poteškoćama, u radu je dan teorijskidokaz globalne konvergencije navedenog optimizacijskog problema za učenje matrice reprezentacije.

''Novi algoritmi su značajno poboljšali točnost u usporedbi s postojećim metodama na svim testiranim primjenama.'' – zaključuje Brbić.

Podijeli