Google pokreće Gemini 2.5 Flash Image kako bi izazvao ChatGPT

Google je službeno predstavio značajnu nadogradnju svog Gemini AI uređivača slika, uvodeći nove mogućnosti koje ga pozicioniraju kao izravnog konkurenta OpenAI-jevom ChatGPT-u i drugim vodećim platformama za generiranje AI slika. Ažuriranje, nazvano Gemini 2.5 Flash Image, predstavljeno je u utorak i donosi poboljšanu preciznost uređivanja uz zadržavanje konzistentnosti likova — što je ključna slabost kod konkurentskih modela.

Novi model predstavlja najnoviji pokušaj Googlea da sustigne dominaciju OpenAI-ja na polju generiranja AI slika. Prema sudskim dokumentima otkrivenim u travnju 2025., ChatGPT održava značajnu prednost s otprilike 600 milijuna mjesečno aktivnih korisnika u usporedbi s Gemini-jevih 350 milijuna. Međutim, izgleda da Google poduzima strateške poteze kako bi smanjio taj jaz.

Nadogradnja dolazi iz Googleove DeepMind divizije i temelji se na postojećim AI mogućnostima tvrtke za obradu slika. Ono što ovaj model izdvaja je njegova sposobnost da prilikom uređivanja sačuva crte lica, životinjske karakteristike i druge vizualne detalje — područje u kojem ChatGPT i ostali konkurenti često imaju problema. Na primjer, prilikom zahtjeva ChatGPT-u da promijeni boju majice često dolazi do izobličenih lica ili promijenjenih pozadina, dok novi Gemini editor održava vizualnu dosljednost.

Više: pcmag.com

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)