Prijevara umjetne inteligencije poezijom

Istraživači talijanskog laboratorija Icaro Laba iz Rima kažu da je njihova nova studija pokazala kako struktura i stil p oezije koja uključuje poetske metafore, ritam i strofnu formu, mogu biti dovoljni da obore zaštitne/odgovorne mehanizme u modelima (naprave tzv. jailbreak ), bez promjene značenja izvornog zabranjenog zahtjeva.
Ispitivanje je provedeno nad 25 suvremenih LLM-ova, vlasničkih i otvorenih od raznih proizvođača, uključujući Google, OpenAI, Metu, Mistral AI i xAI .
Napravljena su dva seta promptova, odnosno tzv. " adversarial " pjesnički...
- Objavljeno u Novosti








