Megérkezett a Google mesterséges intelligencia képmodelljének legújabb verziója, köszönhetően Ikrek 3. Akár hivatalos nevén (Gemini 3 Pro Image), akár ismertebb becenevén (nano banana pro) hívja, ez a modell a Gemini „mély gondolkodás” funkcióját használja jobb tartalom létrehozásához.
A Nano banana pro képességesebbnek ígérkezik, különösen az olvasható szöveg generálásával, akár 14 referenciakép felhasználásával és akár 4K felbontású képek készítésével.
Legfeljebb 14 különálló referenciaképet tölthet fel a nano banana pro-ba. Figyelje meg, hogy a promptban (balra) szereplő karakterek változatlanul jelennek meg a végső képen (jobbra).
A Nano banana pro már elérhető, és világszerte elérhető a Gemini alkalmazásban. A Geminiben válassza a „Képek létrehozása” lehetőséget (🍌 emojival), és állítsa át modelljét Gondolkodó modellre (a prompt ablak jobb oldalán található).
A nano banana pro ingyenesen használható, de gyorsabban eléri a generációs korlátot, mint a fizető Google AI-előfizetők. Ezek a tervek havi 20 dollártól kezdődnek. A rendszer automatikusan visszakapcsol az eredeti modellre, miután felhasználta a jóváírást. A modell elérhető a Gemini API-ban, a Google AI Studio-ban és Folyik.
Az új nano banán modell belsejében
Az AI képgenerátorok köztudottan küzdöttek az egyértelmű szöveg létrehozásával; Az elrontott szavak egyértelmű jelei annak, hogy egy képet mesterséges intelligencia segítségével hoztak létre. Az OpenAI GPT-Image-1 volt az egyik első modell, amely jelentős előrelépést tett ennek javításában, de A CNET tesztelése megmutatta, hogy nem tud megbízhatóan olvasható szöveget létrehozni.
A Google szerint a nano banana pro állítólag jobb ebben – olyan jó, hogy az új modellt infografikák készítésére is használhatja, a Gemini és a Google Keresés integrációjára (és a kereső AI módjára a fizető Pro felhasználók számára) támaszkodva, hogy segítse a folyamatot.
Példa a nano banana pro-val készült infografikára.
Talán észrevette, hogy a nano banana pro-val készült képek egyikén sem található a Google rombusz alakú vízjele, amely általában azt jelzi, hogy mesterséges intelligenciával készült. Ennek az az oka, hogy a Google új módszert vezet be a legjobban fizető előfizetői számára (akik havi 250 dollárt fizetnek Ultra terv) a vízjelek eltávolításához. Annak ellenére, hogy ez a felső szintű tervre korlátozódik, már az rendkívül nehéz megmondani ha valamit mesterséges intelligencia segítségével hoztak létre. A kevesebb vízjel nem segít. A Google szerint a Gemini képes lesz azonosítani a mesterséges intelligenciájával készített képeket a SynthID, a mesterséges intelligencia által generált tartalomhoz csatolt láthatatlan vízjel miatt. Tehát elméletileg feltölthet egy képet a Geminire, és megkérdezheti, hogy valódi-e, vagy a Google mesterséges intelligenciájával készült. Várnunk kell, és meglátjuk, milyen jól működik valójában.
Ne hagyja ki elfogulatlan műszaki tartalmainkat és laboratóriumi értékeléseinket sem. Adja hozzá a CNET-t preferált Google-forrásként.
Az eredeti nano banán modell, a Gemini 2.5 Flash Image idén nyáron jelent meg. A korai tesztelők úgy gondolták, hogy a képességek banánból állnak. Vezessen be egy sor gyümölcs-témájú kedvcsinálót a Google vezetőitől, és a modell gyorsan a nano banán becenevével vált ismertté. A népszerűsége szárnyalt a következő napokban.
Az egyik dolog, amit a rajongók szerettek az eredeti nanobanánban, az volt, hogy milyen jól megőrizte karakterének konzisztenciáját. Ez azt jelenti, hogy a nano banán képes volt szerkeszteni a meglévő fényképeket anélkül, hogy eltorzította volna a rajtuk szereplő karaktereket vagy személyeket. A CNET gyakorlati tesztelése szerint ez igaz, de még mindig voltak nyilvánvaló AI csúszások. Az új modell néhány hibát kiküszöbölhet.
Ez egy nagy hét volt a Google számára, mivel jelentős frissítést adott be mesterséges intelligencia rendszeréhez, a Gemini 3-hoz. Az új modellek most kerülnek bevezetésre, hogy a Gemini felhasználók okosabbak legyenek, kevésbé szipofáns tapasztalat.
További információért nézze meg hogyan írjuk meg a legjobb mesterséges intelligencia képpromptot és a legjobb AI képgenerátorok.









