Google priznao da je fejkao video test Geminija

  • Objavljeno u Svijet
image

Google se ovih dana potrudio da se u svim rezultatima pretraživanja interneta njegova prezentacija Gemini modela umjetne inteligencije  nađe na vrhu, što znači da je postigao veliki hype svojim AI-jem za koji tvrdi da je bolji od svih drugih, uključujući Open AI-jev GPT-4, koji pogoni ChatGPT.

Prema pisanju Bloobergove kolumnistice Parmy Olson, prezentacijski video "Hands-on with Gemini: Interacting with multimodal AI", nije u potpunosti točan, jer je Google navodno ufrizirao neke informacije i metodologije testova o Geminiju.

Video između ostaloga prikazuje Geminijeve multimodalne sposobnosti među kojima su govorne upute za razgovor u kombinaciji s prepoznavanjem slika, odnosno brzo prepoznavanje slika u roku od nekoliko sekundi i prati kuglicu papira u igri čašice i loptice u stvarnom vremenu, kao što možete vidjeti u ovom videu.

Olsen tvrdi da je video bio uređen (čitaj ufriziran) jer se video demonstracija nije dogodila u stvarnom vremenu s izgovorenim uputama, već je umjesto toga koristila nepomične slike iz neobrađene snimke, a zatim ispisala tekstualne upute na koje je Gemini odgovarao.

Olsen kaže da sam Google to priznaje jer je u opisu videa na YouTubeu napisao:

"Za potrebe ove demonstracije, latencija je smanjena, a Gemini izlazi su skraćeni radi kratkoće."

Olsen kaže da je to potpuno drugačije od onoga što je Google tvrdio, odnosno da osoba može voditi nesmetan glasovni razgovor s Geminijem dok u stvarnom vremenu odgovara na svijet oko sebe.

Google za Verge poriče da se radi o "fejkanju", već upućuje na post suvoditelja Gemini programa Oriola Vinyalsa na X-u, u kojem se navodi: Sve korisničke upute i rezultati u videu su stvarni, skraćeni radi sažetosti. Video ilustrira kako bi mogla izgledati multimodalna korisnička iskustva izgrađena pomoću Geminija. Napravili smo ga da inspiriramo programere. Kada izrađujete aplikaciju, možete dobiti slične rezultate (uvijek postoje neke varijabilnosti s LLM-om) tako da Gemini zatražite uputu koja korisniku omogućuje da 'konfigurira' ponašanje modela, poput unosa 'vi ste stručnjak u znanosti', prije nego što se korisnik može uključiti u istu vrstu dijaloga naprijed-natrag.

Olsen kaže da ovo baca sjenku sumnje na čitavu prezentaciju i po njezinom mišljenju "Googleov Gemini izgleda izvanredno, ali je još uvijek iza OpenAI-ja", te smatra da bi Google trebao biti puno oprezniji sa svojim prezentacijama ako doista želi impresionirati developere aplikacija i javnost svojim novim AI proizvodom.

Podijeli