A Google június 30-án kiadta a Gemini 3.1 Flash Image és a Gemini 3 Pro Image képgeneráló modelleket. Azonnal elérhetők a Gemini rendszerén keresztül. Ha valaha fizettél stockfotóért vagy vártál napokat egy grafikusra, ez a hír neked szól.
Na, a Google megint nem aprózta el. Nem egy, hanem rögtön két új képgeneráló modellt tett le az asztalra. A Gemini 3.1 Flash Image a gyors, hétköznapi munkaló. A Gemini 3 Pro Image pedig a nagyágyú, amikor a pontosság fontosabb, mint a sebesség.
És itt jön a lényeg: mindkettő azonnal elérhető a Gemini rendszerén keresztül. Nem kell várólistára feliratkozni, nem kell külön szoftvert telepíteni.
Mit tud a két új modell?
Gyorsan tisztázzuk: a „modell” itt azt a mesterséges intelligenciát jelenti, ami a képeket létrehozza a szöveges leírásod alapján. Beírod, mit szeretnél, és megkapod a képet. Ennyi!
A Flash változat (a Google belsős becenevén „Nano Banana 2”) a mindennapi használatra készült. Gyors, olcsó, és meglepően jó minőséget ad. A Pro változat pedig az összetettebb feladatoké: pontosabb szövegmegjelenítés a képeken, jobb kontroll a részletek felett.
De van itt valami érdekes: az új modellek végre tisztességesen kezelik a képen belüli szöveget. Ez eddig az AI képgenerálás egyik legnagyobb gyengesége volt. Emlékszel azokra a képekre, ahol a felirat úgy nézett ki, mintha egy macska sétált volna végig a billentyűzeten? Na, ennek lassan vége.
Ráadásul minden elkészült kép láthatatlan SynthID vízjelet kap. Így utólag azonosítható, hogy AI készítette. Ez szerintem korrekt lépés a Google-tól.
A részleteket a Google a hivatalos blogján mutatta be, érdemes átfutni.
Miért fontos ez neked, ha nem vagy grafikus?
Gondolj bele: eddig ha kellett egy kép a Facebook posztodhoz, három lehetőséged volt. Fizetsz stockfotóért, megbízol egy grafikust, vagy összetákolsz valamit magad. Az első kettő pénz, a harmadik idő és bosszúság.
Most viszont az AI képgenerálás beépül abba az eszközbe, amit valószínűleg már most is használsz. Közösségi posztok, hirdetési kreatívok, prezentációs illusztrációk – mindezt megcsinálod pár perc alatt, külön szakértelem nélkül.
Amit én a tréningjeimen látok: a legtöbb kisvállalkozó nem azért nem használ profi vizuális anyagokat, mert nem akar. Hanem mert eddig ez vagy drága volt, vagy macerás. Ez a korlát most gyakorlatilag eltűnik. A kérdés már nem az, hogy megengedheted-e magadnak – hanem hogy megtanulod-e használni.
AI képgenerálás a gyakorlatban – mire figyelj?
A helyzet a következő: attól, hogy az eszköz jó, a végeredmény még nem lesz automatikusan az.
Az AI képgenerálás akkor működik igazán, ha pontosan meg tudod fogalmazni, mit szeretnél. Ez a prompt – vagyis az utasítás, amit a modellnek adsz. Minél konkrétabb vagy, annál jobb képet kapsz. „Egy kép a termékemről” helyett próbáld így: „letisztult termékfotó fehér háttéren, természetes fénnyel, felülnézetből”.
Nem megy magától. De nem is kell hozzá diploma.
A tanácsom: próbáld ki, mielőtt a következő kampányodhoz stockfotókra vagy külsős tervezőre költenél. Adj neki egy délutánt. Generálj tíz-húsz képet, nézd meg, mire jut. A legrosszabb esetben tanultál valamit. A legjobb esetben pedig találtál egy eszközt, ami havonta tízezreket spórol neked.
Én már teszteltem mindkét modellt, és a tapasztalataimról hamarosan írok egy külön cikket is. Addig is: te mire használnád először? Gondold végig – aztán csináld is meg. 🙂
Hamarosan élesedő EU-s AI szabályzás miatt mindenkép érdemes szánni egy pár percet a korábbi cikkem olvasására. Ugyan úgy használhatod továbbra is az AI-t és fel is használhatod a képeket, szövegeket, de ezt már csak megjelöléssel teheted!