2025. augusztus 29.

Mi a tököm az a Nano Banana?

Amikor néhány hete először hallottam a Nano Bananáról, megkérdeztem a Geminit, a Google saját mesterséges intelligenciáját, hogy mit kell róla tudni. A válasz ez volt: “A Nano Banana a banán egy kompakt változata, amely egy kisebb, szobai növény, és nem nő meg olyan hatalmasra, mint a hagyományos banánfák. Ennek az az előnye, hogy könnyen tartható lakásban vagy kisebb kertekben. Kis mérete miatt a termése is kisebb, de ugyanolyan tápláló, mint a normál banán, ráadásul hamarabb is érik.”

Köszi.

Pár perc keresgélés után kiderült, hogy itt bizony nem egy új gyümölcsfajtáról, hanem egy fejlett képgeneráló és képszerkesztő AI-ról van szó. Az Lmarena oldalon folyamatosan követhető, hogy a tesztelők szerint éppen melyik AI-modell teljesít a legjobban — legyen szó szövegértelmezésről, fejlesztésről, kép- vagy videógenerálásról, illetve képszerkesztésről. Aki mostanában (fontos megjegyezni, hogy e cikk az Úr 2025. évének szeptember havában íródott ) rápillantott az Lmarena image edit listájára, az láthatta, hogy a Nano Banana nevű modell vezeti szinte az összes kép-generáló és szerkesztő rangsort.

De mi is ez pontosan? A Nano Banana a Google új képgeneráló és szerkesztő AI-ja, amely már a Gemini alkalmazásba is be van építve (az ingyenes verzióba is), így ez lett az alapértelmezett megoldás. Az ereje abban rejlik, hogy konzisztensen ábrázolja ugyanazt a szereplőt vagy tárgyat, vagyis sokkal kevésbé torzít, mint a korábbi modellek. Eddig a Flux Kontext számított etalonnak ezen a téren, őt követte a ChatGPT képi modellje, de most a Nano Banana átvette a vezetést (legalábbis a tesztelők szerint biztos).

A Nano Banana egyik legnagyobb előnye a karakter- és jelenetkonzisztencia. Ez azt jelenti, hogy egy adott arc, tárgy vagy akár vizuális stílus több képen keresztül is következetesen megjelenik. A korábbi modellek gyakran „szétestek” több iteráció után, míg a Nano Banana megbízhatóbb, stabilabb outputot ad, amivel időt és utómunkát lehet spórolni. 

A Nano Banana nemcsak pontosabban értelmezi a természetes nyelvű promptokat, de sokkal kevesebb körben kell finomítani a kéréseket. Gyorsabb munkafolyamatot biztosít, amely közelebb viszi az AI-t a valódi kreatív asszisztens szerepéhez. Ez a gyakorlatban azt jelenti, hogy a tartalomkészítők olyan eszközhöz jutnak, amellyel felgyorsítható a kreatív munkát. 

Na de nézzük gyakorlatban és mindenki döntse el maga (érted MAGA). 

1. Az eredeti kép.
2. Igya meg a sört.
3. Üljön a tengerparton és legyen a fején egy pink-sárga baseball sapka.

Ez is érdekelhet

Szeretett ügyfeleink

Continental
Telex
Marriott
Dallmayr
Ernst & Young
Arena Mall
Ericsson
Egyensúly intézet
Unisys
OESL
Szászi Birtok
Total Energies
Fény utcai piac
Mammut
Fitting
BT
Visual Labs
Bunge
Hydro
Erste
Intercars
Wienerberger
NNG
Siemens Energy
Sanofi
Prangl
One