Home Hír A Gemini ‘Nano Bananas’ AI képszerkesztése szórakoztató, de túl sok csúszásba kerültem

A Gemini ‘Nano Bananas’ AI képszerkesztése szórakoztató, de túl sok csúszásba kerültem

3
0

Kipróbáltam a képszerkesztési képességeket a Google legújabbjában generatív AI modell, és te is tudsz. Gemini 2.5 flash képnek nevezték el frissítés Az a képesség, hogy a fotóit natív módon szerkeszti az Ikrekben.

Az AI rajongók „Nano banán” modellnek nevezték, amelyet egy sor ugrálással ösztönözött Google végrehajtók– A Google ebben az évben nagymértékben befektetett a generatív médiamodellekbe, és a kép- és videogenerátor modelljeinek frissített verzióit dobta el Éves I/O fejlesztői konferencia– A Google AI videogenerátora Látom 3 Megdöbbent a szinkronizált audióval, az első az AI óriások között. És az alkotók többet tettek, mint 100 millió AI videó A Google AI filmkészítő eszközével, a Flow.

Nagyon sok időt töltöttem az AI kreatív szoftver tesztelésével, és izgatottan láttam, hogy a Google legújabb cseppje az összes banán rajongó közepette. De a 2.5 Flash kép tesztelése azt mutatta, hogy csak azért, mert valami mutató bejárata van, nem azt jelenti, hogy ez mindig a hype -nek felel meg. Így ment a tapasztalataim a Gemini Nano banánnal: A jó, a rossz és a frusztráló.

Mi működött

A Gemini Bananas-modell kísértetiesen jó az elemek hozzáadását a meglévő képekhez, és az AI által generált elemeket jól keveri minden olyan képhez, amelyet elcsúsztatott. Ezenkívül fenntartja a karakterkonzisztencia tisztességesen stabil szintjét is – azaz a képeimben szereplő emberek nem voltak túl torzultak vagy nem voltak elcsábítottak az AI -feldolgozáson keresztül. Ez egyaránt fontos megkülönböztetés az AI képprogramok számára, és a Google azt mondta, hogy javult.

Mindkét jellemzőt láthatja a nővérem és én képen. Általános megjelenéseink nem változnak a szerkesztett verzióban (jobbra), megmutatva ezt a karakter konzisztenciáját. Arra kértem Ikrét, hogy adjon hozzá egy harmadik húgot, aki hasonlónak nézett ki kettőnkhöz, és ez kissé jól teljesített, ha egy harmadik nőt adtak hozzá ketten köztünk.

Üdvözöljük a családban, félesen pontos kinézetű AI nővér.

Katelyn Chedraoui/Ikrek

Nagyon lenyűgözött az is, hogy az Ikrek milyen gyorsan tudtak kiköpve kitölteni a kitöltött képeket. Bárhol, egy perc alatt, kap tőlem egy aranycsillagot, és Ikrek rendszeresen kezelték a kérelmeket 15 másodperc alatt. Nagyra értékeltem azt is, hogy miként adta hozzá a vízjelet az összes létrehozott és szerkesztett képhez – még akkor is, ha nem szeretem, hogy a technológiai vállalatok hogyan rendelkeznek megsérült az AI szikra hangulatjelekRendkívül fontos, hogy legyen valami AI által generált tartalom markerei– A Google szintetikus és a színfalak mögötti munkája szintén segít megkülönböztetni az AI tartalmat az ember által létrehozott képektől.

Az Ikrek jó a nagykereskedelmi AI -kép létrehozásában, de azt javaslom, hogy használja a Imagen 4 vagy másikját AI képgenerátor Ehelyett-több gyakorlati kezelőszervvel és beállítással rendelkeznek, amelyek közelebb kerülnek ahhoz, amit kevesebb munkával akarnak.

Ami valójában nem működött

A Gemini Bananas komoly korlátai vannak. Ez automatikusan négyzet alakú képeket generált, és a nyomon követési utasításokat kérik, hogy a képeket más dimenziókhoz igazítsák.

Azt is észrevettem, hogy az Ikrek sok fotóm felbontását csökkentik. Elsősorban fényképeket készítek az iPhone 16 -mal, amelynek csillagkamerái vannak, de miután átmentek a Gemini banán modellen, ezek a finom részletek gyakran elmosódtak. Ez bosszantó, és nem nyer semmilyen fotós felett.

Annak ellenére, hogy a célgyűrűk felvilágosítása iránti kérelem, az eredeti (balra) több gazdagság és textúra van, mint az Ai szerkesztett (jobbra).

Katelyn Chedraoui/Ikrek

Többször megpróbáltam rávenni a Gemini -t a fotószerkesztések kezelésére, amelyeket nekem nehéz lett volna. Ez egy olyan terület a fotószerkesztésben, ahol az AI állítólag kiemelkedik-a hétköznapi, de részletintenzív szerkesztések automatizálása. Sajnos Gemini nagyon küzdött itt az azonnali ragaszkodással, azaz nem azt tette, amit kértem.

Sokszor megpróbáltam rávenni az Ikreket, hogy eltávolítsák a gondolatokat egy legrosszabb pénteki film poszter pillanatából, de makacsul maradtak. És minél inkább megpróbáltam megszerezni a reflexiók eltávolítását, annál rosszabb lett a kép minősége. Miután a tisztítás után a szöveget végső soron olvashatatlanná tették, miután végül feladtam, nem is beszélve a Lindsey Lohan és Jamie Lee Curtis arcainak véletlen, ijesztő kinézetű károsodásáról.

A Gemini Nano banán küzdött, hogy különböző dimenziókban képeket generáljon. A képek átméretezése és kivágása egy alapvető fotószerkesztési folyamat, de az Ikrek nem – vagy nem tudták – nem kezelték az egyszerű méretezési útmutatásokat.

Csak annyit akartam, hogy az Ikrek eltávolítsák a reflexiót a poszter jobb felső sarkában, de ehelyett a filmcímke és az arcok megsemmisítette.

Katelyn Chedraoui/Ikrek

Felhívtam a kapcsolatot a Google -val a felbontási és dimenzióval kapcsolatos kérdésekről, és egy szóvivő azt mondta, hogy a technológiai vállalat „tudatosan dolgozik és aktívan dolgozik mindkét kérdésben. Ez nagy frissítés volt az előző modellünktől, de tovább fejlesztjük a modellt”.

Összességében a Gemini Nano banán bebizonyította, hogy a Google komolyan veszi a dominálást a generációs médiában. De jelentős buktatókkal rendelkezik, túlságosan nagy hangsúlyt fektetnek az új elemek előállítására, ahelyett, hogy az AI -t használnák a közös fotóproblémák javításához és módosításához. Jelenleg a Nano Bananas modell a legmegfelelőbb az Ikrek rajongói számára, akik gyorsan szeretnének nagy szerkesztéseket. Azoknak, akik pontosabb eszközöket keresnek, meg kell várnunk a Google következő nagy frissítését, vagy meg kell találnunk egy másik programot.

Ikrek Nano banán rendelkezésre állása, árazás és magánélet

Nem kell semmit tennie az új modell eléréséhez; automatikusan hozzáadódik a Base Gemini 2.5 flash modellhez. A Gemini ingyenesen elérhető, több modell és magasabb felhasználási sapkák állnak rendelkezésre a Google AI terveiben 20 dollár havonta

Ha fizető előfizető vagy, akkor a Google AI Stúdión keresztül is hozzáférhet a modellhez. Innentől csak annyit kell tennie, hogy feltölt egy képet, és írja be a parancsot. Mindegyik prompt bárhol egy -kétezer token -t használ, a szükséges részletek szintjétől függően. Az Adobe Express és a Firefly felhasználók most is hozzáférhetnek az új modellhez.

Google Ikrek adatvédelmi irányelve Azt mondja, hogy felhasználhatja a feltöltött információkat az AI termékek fejlesztéséhez, ezért a vállalat azt javasolja, hogy kerülje az érzékeny vagy magáninformációk feltöltését. A cégé AI tiltó felhasználási politika szintén tiltja az illegális vagy visszaélésszerű anyag létrehozását.

További információkért nézze meg a A legjobb AI képgenerátorok és Minden, amit a Google Pixel 10 rendezvényen jelentettek be

Fuente de noticias