Googleov AI razvio novi slikarski stil
- Objavljeno u Novosti
Googleovi računalni znanstvenici Alexander Mordvintsev, Christopher Olah i Mike Tyka, primijetili su veliki napredak u razvoju sustava za prepoznavanje objekata na slikama i razumijevanja glasa, no usprkos činjenici da su to vrlo korisne stvari koje koriste alate temeljene na poznatim matematičkim metodama, shvatili su da zapravo vrlo malo razumijemo zašto određeni modeli funkcioniraju, a drugi ne,
Stoga su oni AI neuralnu mrežu „nahranili" s milijunima primjera, te podešavali mrežne parametre sve dok nisu dobili klasifikacije koje su željeli. Mreža se uglavnom sastoji od 10-30 "stacked" slojeva umjetnih neurona. Svaka slika se postavlja u jedan input sloj koji potom komunicira sa susjednim, sve dok se na dođe do "output" sloja. Potom mreža stvara odgovor koristeći taj posljednji output "layer".
Jedan od izazova je bio omogućiti neuralnoj mreži da prepozna što se točno događa na svakom sloju, a nakon "treninga", svaki sloj je progresivno ekstrahirao sve više razine značajki na slikama, sve dok posljednji nije donio odluku o tome što slika prikazuje.
Nakon toga, znanstvenici su pomagali neuralnoj mreži u razumijevanju slika, te ju natjerali da pojača input slike na taj način da izražava točno određenu interpretaciju
Neuralne mreže koje su trenirane da prepoznaju razlike između drugačijih vrsta slika, prema mišljenju znanstvenika, začuđujuće su dobile dovoljno informacija da i same kreiraju slike. Ova značajka je po njima vrlo važna u tome da budemo sigurni da je računalna mreža na dobar način naučila prave značajke, što može pomoći u njezinom vizualiziranju raznih objekata poput vilice ili banane.
Zanimljivo je također da neuralna mreža nije uvijek prepoznavala važne značajke na slikama onako kako su to znanstvenici očekivali, jer neke stvari nije mogla točno prepoznati, ukoliko uz njih nije bio drugi objekt, pa se recimo izgubila u prepoznavanju utega, ako uz njega nije bila ruka dizača koja ju je držala, jer vjerojatno nikada nije vidjela uteg bez ruke.
Svaki sloj mreže se koristi s različitim značajkama koje izvlači, pa kompleksnost značajki koje se generiraju ovisi u tome za koji se sloj odlučujemo da bude od veće važnosti.
Među naredbama koje je mreža dobivala, nalazila se i "što god da vidiš ovdje, želimo više toga". To je kreiralo svojevrsnu feedback petlju, pa ako oblak recimo nalikuje psu, ona će se potruditi da to još više naglasi.
Rezultati svega toga su vrlo intrigantni, jer je neuralna mreža počela kreirati psihodelične inačice slika koje je interpretirala iz originala, pa je tako na primjeru poznatog "Vriska", pretvorila ljusku figuru u psa, jer ju je originalna glava po nečemu podsjećala na psa. Šteta što ne možemo pitati Edvarda Muncha ima li njegov Vrisak na bilo koji način veze sa psom, no možda se oglasi neki likovni kritičar pa nas i računalne znanstvenike pošalje jednostavno k vragu.
Znanstvenici su također otkrili da su, pri dodavanju zumiranja na svaki output algoritma nakon svake interpretacije, došli do beskonačnih inačica impresija, kojima je mreža istraživala set stvari koje je poznavala. Kada su znanstvenici započinjali proces sa slikom generiranom od "slučajnog šuma", neuralna mreža je počela stvarati svoje vlastite umjetničke slike, u koje je uključivala elemente kreirane prema onome na što ju je nešto podsjećalo, slično kao što to rade oni slikari kojima nije cilj reproducirati viđeno na realistični način, već prezentirati svoj pogled na određene stvari.
Time je nastao svojevrsni novi pravac u AI likovnoj umjetnosti koji su nazvali "Inceptionizmom".
Mada bi netko mogao reći da se računalo koristi sustavom obrade slika nekakvim filterima u stilu Photoshopa, ono zapravo samostalno smišlja interpretacije, mada mu u tome ipak treba mali poticaj od strane ljudi.
Izvor: Google Research Blog