Objavili AI model za uređivanje slika
- Objavljeno u Svijet
Apple trenutno nije jedan od vodećih igrača u području umjetne inteligencije, ali tvrtkina nova otvorena AI platforma za uređivanje slika pokazuje što je sposobna doprinijeti tom prostoru. Model nazvan MLLM-Guided Image Editing (MGIE) koristi multimodalne velike jezične modele (MLLM) za tumačenje naredbi temeljenih na tekstu prilikom manipulacije slikama.
Drugim riječima, alat ima sposobnost uređivanja fotografija na temelju teksta koji korisnik unese. Iako nije prvi alat koji to može raditi, „ljudske upute ponekad su prekratke za trenutačne metode da ih uhvate i prate“, navodi se u radu projekta (PDF).
Tvrtka je razvila MGIE u suradnji s istraživačima sa Sveučilišta Kalifornija, Santa Barbara. MLLM-ovi imaju moć pretvaranja jednostavnih ili nejasnih tekstualnih upita u detaljnije i jasnije upute koje sam uređivač fotografija može slijediti. Na primjer, ako korisnik želi urediti fotografiju pepperoni pizze da bude „zdravija“, MLLM-ovi to mogu tumačiti kao „dodaj povrće“ i urediti fotografiju prema tome.
Osim što može napraviti velike promjene na slikama, MGIE može i izrezivati, mijenjati veličinu i rotirati fotografije, kao i poboljšati svjetlinu, kontrast i ravnotežu boja, sve putem tekstualnih uputa. Također može uređivati određene dijelove fotografije i, primjerice, mijenjati kosu, oči i odjeću osobe na njoj, ili uklanjati elemente u pozadini.
Kako ističe portal VentureBeat, Apple je model objavio putem GitHuba, ali zainteresirani mogu isprobati i demo verziju koja se trenutno nalazi na Hugging Face Spaces. Apple još nije izjavio planira li koristiti ono što nauči iz ovog projekta za alat ili značajku koju može ugraditi u neki od svojih proizvoda.