Home Hír A Google Nano Banana Pro ultrarealisztikus AI képeket készít. A pokolba ijeszt

A Google Nano Banana Pro ultrarealisztikus AI képeket készít. A pokolba ijeszt

1
0

Az egyik legfontosabb dolog, amit az új mesterséges intelligencia kép- és videógenerátorok tesztelésekor teszek, hogy megpróbáljam kideríteni, hogy a vállalat állításai igazak-e, vagy marketingesek. A Google ezt ígérte nano banán pro elhozná a Gemini 3 világ megértését és a Google Keresés információs erejét a mesterséges intelligencia képeibe. Már a megjelenése után belevágtam az új modellbe, és őszintén szólva szerintem a Google alulmúlta a képességeit.

A eredeti nano banán modell rendkívül népszerű volt, bár mint minden mesterséges intelligencia szolgáltatás, ilyen is volt vakító területek javítására. Van egy terület, ahol már nagyon lenyűgözött az új profi verzió: Valóban képes kezelni az összetett szöveg-megjelenítést a képeken. A Nano banana pro összetett infografikákat tud készíteni, és feliratokat ad a képekhez anélkül, hogy a szokásos hallucinációk közül több lenne. Ez megváltoztatja a játékot, de talán nem úgy, ahogy reméljük. A profival végzett kezdeti tesztelésem során ez állandó érzés volt. A profi modell kiváló, még ha rendkívül idegesítő módon is.

Íme, amit a kezdeti tesztelésem mutatott, sok nano banán pro képpel kiegészítve. Ha szeretnéd kipróbálni magad, itt van a legolcsóbb módja annak, hogy hozzáférjenegyütt A Google új AI képérzékelője.

Ultrarealista emberek és karakterek

A Riverdale tévéműsor nem hiányzott nekünk a nevetséges, mémekbe illő párbeszédekből, de számomra semmi sem viccesebb, mint Archie szava a „középiskolai futball epikus csúcsairól és mélypontjairól”. Mint valaki, akinek a középiskolai futballcsapata háromszoros állami bajnok volt, láthattam, honnan jön Archie. A Nano banana pro képes volt újrateremteni a pillanatot.

Ez egy tökéletes képe KJ Apáról, aki Archie-t alakította, bár nem a juvie-ban van, mint az eredeti jelenetben.

Katelyn Chedraoui készítette Gemini AI segítségével

A Gemini kezdetben megtagadta kérésemet, amikor a „KJ Apa” és a „Riverdale” nevet használtam a felszólításomban (ahogy feltétlenül kell), de kiköpte ezt a túlságosan pontosnak tűnő képet, miután egyszerűen töröltem a neveket. Ez a módszer nem mindig működött – a Gemini nem jelölte meg a Legally Blonde-hoz hasonló jelenetre vonatkozó kérésemet, de Reese Witherspoon felismerhető hasonlóságát sem ragadta meg. De kaptam két pontos ábrázolást Dr. Seuss Grinch-jéről: a Jim Carrey-verziót és a Benedict Cumberbatch által megszólaltatott rajzfilmet.

Dr. Suess valószínűleg éppen a sírjában gurul.

Katelyn Chedraoui készítette Gemini AI segítségével

Bár ezek az eredmények lenyűgözőek, nem jó dolog, hogy az Ikrek képes létrehozni őket. Hírességek, közéleti személyiségek és más felismerhető emberek aggodalmának adott hangot arról, hogy az AI-eszközök hogyan könnyítik meg bárki számára valósághű AI-verziók létrehozását. Az AI-cégek azt mondták, hogy vannak technikai akadályok és irányelvek a visszaélések megelőzésére, de már láttuk, hogy ezek a rendszerek hogyan hibázhatnak. Ahogy az olyan új modellek, mint a nano banana pro egyre jobban képesek ilyen képek és videók létrehozására, még nehezebbé teszi annak megállapítását, hogy valami valódi vagy mesterséges intelligencia.

Nevetségesen pontos szövegvisszaadás képekben

Az üzletek feliratai, a pólólogók és gyakorlatilag minden olyan tárgy, amelyhez jól olvasható szöveg szükséges, régóta kínozzák az AI képgenerátorokat. Ezek a hibák jót tettek nekünk, amikor arra utaló jeleket keresünk, hogy valamit mesterséges intelligencia segítségével hoztak-e létre, mert a szöveg mindig összezavarodik. De a nano banana pro szinte teljesen megoldja ezt a problémát, jóban vagy rosszban.

Az AI-cégek régóta törekedtek arra, hogy olvasható szöveget hozzanak létre generatív médiájukban. Az OpenAI első képmodellje – amelyről emlékezhet, arra ösztönözte az embereket, hogy Studio Ghibli-verziókat készítsenek magukról – a képek szöveggenerálásában kellett jeleskedniük. De a tesztem azt mutatta, hogy még mindig nagy problémák vannak vele.

A Nano banana pro infografikájában szinte nincsenek látható hibák. Ezenkívül a formatervezése letisztult, jól szervezett és hatékony. Nézz meg néhányat az általam generáltak közül.

A ChatGPT valóban küszködött az elírási hibákkal, és a vízkörforgás hamis szakaszait találta ki. A Nano banana pro remekelt.

Katelyn Chedraoui készítette Gemini AI segítségével

A Nano banana pro a Google Keresés forrásaira támaszkodik az infografikák létrehozásához.

Katelyn Chedraoui készítette Gemini AI segítségével

A Nano banana pro infografika bonyolult témákat is lebonthat, például ebben a meta-tervben, amely az AI képgenerátorok működését mutatja be.

Katelyn Chedraoui készítette Gemini AI segítségével

A Nano banana pro a Gemini 3-mal készült, és a Google Search hatalmas online tartalomadatbázisára támaszkodik az infografikák létrehozásához. De ha nem akarja, hogy a Google válassza ki a forrást, akkor a promptba felveheti azokat a forrásokat, amelyekből le szeretné gyűjteni. Megadtam Gemininek a linket az enyémhez részletes beszámoló a hollywoodi mesterséges intelligencia hatalmi harcáról ennek tesztelésére, és el kell ismernem, ez egy nagyon jó vizuális megjelenítése a történetnek.

Ez pontosan azt teszi, amit egy infografikának kell tennie, ha a történetet a főbb témáihoz sűríti, és összekapcsolja őket. Ráadásul kértem benne a (régi) CNET logót és a forrást is.

Katelyn Chedraoui készítette a Gemini AINano banán pro segítségével, elkeserítően kiváló

A generatív mesterséges intelligencia fejlődésének számos vízválasztó pillanata volt. Az elmúlt hat hónapban több ilyet láttunk, a Veo 3 bevezette a hangot az AI-videókba, a Sora pedig minden eddiginél egyszerűbbé teszi a mélyhamisítások készítését. Az eredeti nano banán modell egy másik volt, de egyértelműen a profi modell elhomályosítja mindazt, amit az AI képtechnológiában láttunk ebben az évben vagy bármelyik évben. Ezek a nano banana pro AI képek állnak a legközelebb az ember által készített tervekhez és fotózáshoz, amit valaha láttam. Noha nagyon lenyűgözött a Google által bemutatott technikai tudás, ez csak tovább mélyíti aggodalmaimat az ilyen mesterséges intelligencia technológiával való visszaélés miatt.

Megpróbáltam rávenni Geminit, hogy készítsen infografikákat kétes áltudományos elméletekről. Leállított minden olyan kérést, amelyet (helyesen) egészségügyi félretájékoztatásként jelölt meg, bár egy képet átengedett – ami azt mutatja, hogy a helyükön lévő védőkorlátok még mindig tökéletlenek. Már láttuk, hogy ezek az eszközök hogyan használhatók rasszista, visszaélésszerű és illegális tartalmak létrehozására, az AI-cégek erőfeszítései ellenére. A Nano banana pro minden szükséges tűzerővel képes feltölteni a rossz színészek fegyvertárát. Sajnálatos módon biztos vagyok benne, hogy csak idő kérdése, hogy mikor látunk nano-banánnal készített mesterséges intelligencia képeket a vírusos közösségimédia-bejegyzésekhez vagy kampányokhoz csatolva, és szabad szemmel nem tudjuk eldönteni, hogy valódi-e vagy mesterséges intelligencia.

Ugyanakkor, mivel a nano banana pro az elérhető legjobb mesterséges intelligencia képmodell, rendkívül hasznos lesz. Azok, akik gyorsan szeretnének képet készíteni, segíteni szeretnének a meglévő képek szerkesztésében, vagy információs grafikát szeretnének beépíteni munkájukba, kiváló minőségű eredményeket hozhatnak létre. Ez a kétélű kard, amely a generatív média innovációjának velejárója, és a nano banana pro az eddigi legélesebb eszköz – vagy fegyver –.

Fuente de noticias