Grok AI sada može obrađivati slike

  • Objavljeno u Novosti
image

Muskov xAI je najavio novu generaciju multimodalnog AI modela pod nazivom Grok-1.5V, koji sada može obraditi širok izbor vizualnih informacija, uključujući dokumente, dijagrame, screenshotovbe i fotografije.

Tvrtka kaže da je Grok-1.5V konkurentan postojećim multimodalnim modelima u nizu domena, od multidisciplinarnog razmišljanja do razumijevanja dokumenata, znanstvenih dijagrama, grafikona, snimki zaslona i fotografija i posebno naglašavaju sposobnosti u razumijevanju našeg fizičkog svijeta.

Također ističu da Grok nadmašuje svoje konkurente u novom RealWorldQA benchmarku koji mjeri razumijevanje prostora u stvarnom svijetu.

Između ostaloga Grok može iz dijagrama koji opisuje jednostavnu igru ​​pogađanja u kojoj računalo generira nasumični broj koji korisnik mora pogoditi, napraviti Python kod kojim se pokreće igra kao što je opisano u dijagramu toka.

Pored toga, ako vam netko pošalje meme koji zbog nekog razloga ne možete razumjeti, možete ga pokazati Groku, koji će ga detaljno analizirati i izbaciti vam poantu u tekstualnom obliku.

I na kraju, možete mu unijeti svoj jednostavni crtež i zatražite ga da na temelju njega napiše čitavu priču.

xAI navodi da će novu inačicu Groka uskoro testirati postojeći korisnici, no zasad još nije poznato kada će to biti, a također najavljuju da će model u budućnosti unaprijediti zvukom i videom.

Podijeli