Google je službeno predstavio značajnu nadogradnju svog Gemini AI uređivača slika, uvodeći nove mogućnosti koje ga pozicioniraju kao izravnog konkurenta OpenAI-jevom ChatGPT-u i drugim vodećim platformama za generiranje AI slika. Ažuriranje, nazvano Gemini 2.5 Flash Image, predstavljeno je u utorak i donosi poboljšanu preciznost uređivanja uz zadržavanje konzistentnosti likova — što je ključna slabost kod konkurentskih modela.
Novi model predstavlja najnoviji pokušaj Googlea da sustigne dominaciju OpenAI-ja na polju generiranja AI slika. Prema sudskim dokumentima otkrivenim u travnju 2025., ChatGPT održava značajnu prednost s otprilike 600 milijuna mjesečno aktivnih korisnika u usporedbi s Gemini-jevih 350 milijuna. Međutim, izgleda da Google poduzima strateške poteze kako bi smanjio taj jaz.
Nadogradnja dolazi iz Googleove DeepMind divizije i temelji se na postojećim AI mogućnostima tvrtke za obradu slika. Ono što ovaj model izdvaja je njegova sposobnost da prilikom uređivanja sačuva crte lica, životinjske karakteristike i druge vizualne detalje — područje u kojem ChatGPT i ostali konkurenti često imaju problema. Na primjer, prilikom zahtjeva ChatGPT-u da promijeni boju majice često dolazi do izobličenih lica ili promijenjenih pozadina, dok novi Gemini editor održava vizualnu dosljednost.
Više: pcmag.com