Személyes hobbim az, hogy felteszek két különböző chatbotnak ugyanazt a kérdést, és megnézem, melyik ad a legjobb választ. Mint egy professzor, aki megkérdezi a diákokat (amit néha a való életben is teszek önkéntesként), úgy értékelem, hogy a bot hallucinál-e és tényeket talál ki, vagy intelligens és koherens választ ad-e, amely valóban hasznos.
Az „intelligencia” és a „koherencia” nem azok a szavak, amelyeket a chatbotok által általában generált képek leírására használnék. néven ismert Vissza lejtőnezek a furcsa összeállítások – gyakran elmosódott háttérrel, tökéletes emberrel, összebújt hajjal és talán néhány extra hüvelykujjjal – az egész közösségi médiában és még az ehhez hasonló cikkekben is megjelennek a jellemző képként.
A stock képeknek már rossz hírük van. Ez a videó Az Emilia Clarke-kal még mindig az egyik legkedvesebb stock fotóparódiám, és megnevettet, még akkor is, ha jóval a mesterséges intelligencia-csúcs előtt jelent meg:
Az idők változtak. Az OpenAI nemrég frissítette a ChatGPT képgeneráló modell, amellyel versenyezhet Google Gemini és Nano Banana Pro.
Meglepő módon a képek már nem használják ezt a jellegzetes elmosódást, és a tesztjeim során gyakran sokkal valósághűbbnek tűnnek, mint korábban.
Úgy döntöttem, hogy pontosan ugyanazokat az utasításokat használom mindkét chatbotnál, és megnézem, melyik produkálta a leghasznosabb eredményeket. Arról beszélek: egy kép, amelyet felhasználhat egy hirdetési kampányban vagy egy cikkben, valami, amit a közösségi médiában közzétenne szellemes feliratként.
A ChatGPT lenyűgözött a sebességével – egyik stock kép sem tűnt számítógép által generált szemétnek. A Nano Banana Pro azonban előnyben van, mert folyamatosan valósághűbb képeket generált a tesztjeim során. Itt vannak az általam használt promptok és a képek, amelyeket mindkét bot generált, így Ön maga ítélheti meg. (A Nano Banana képek a bal oldalon láthatók.)
1. Podcast AI által generált podcast-képet hallgató személy. A Gemini / Nano Banana a bal oldalon található John Brandon / Digital Trends
Használt felszólítás: Készítsen stock képet valakiről, aki egy divatos irodában podcastot hallgat
Megkértem mindkét botot, hogy készítsenek egy képet valakiről, aki podcastot hallgat egy irodában. A Nano Banana volt a nyerő itt, bár a Nano Banana képen van egy enyhe elmosódás a háttérben, ami halálos ajándék lehet. Az AI azonban megtanulja elkerülni az abszolút tökéletességet. Őszintén szólva, nehezen tudnám meg, hogy a Nano Banana felvételen irodai környezetben lévő nő nem az igazi. A haja kissé kócos (mint valakinek a való életben). A ChatGPT felvételen a podcast-hallgató nem néz ki egészen jól – a fotó egy kicsit túl tökéletes.
2. Hozzon létre egy promóciós képet a könyvemhez, AI által generált kép arról, hogy valaki könyvet olvas. A Gemini / Nano Banana a bal oldalon található John Brandon / Digital Trends
Felhasznált felszólítás: Adja olyan ember kezébe ezt a könyvborítót, aki valóban érdeklődik az olvasás iránt
Ehhez a teszthez feltöltöttem a borítót a saját könyvembe, és megkértem a robotokat, hogy készítsenek egy képet arról, hogy valaki olvassa. A Nano Banana egy kicsit túlszárnyalt, mivel az AI képen valaki túlzottan lelkes. Ennek ellenére a ChatGPT képnek még mindig van egy túlvilági minősége (és ezt rossz értelemben), ami nem tűnik valódinak. A ChatGPT képpel kapcsolatban minden túl tökéletes – a világítás, a póz stb. –, és még mindig CGI-t üvölt.
3. Hozzon létre egy stock képet, amelyet a mesterséges intelligencia képgenerálását illusztráló cikkhez használhat. A Gemini / Nano Banana a bal oldalon található John Brandon / Digital Trends
Felhasznált kérdés: Készítsen egy stock képet, amely egy mesterséges intelligencia képalkotásról szóló cikk mellé illeszthető
A Nano Banana ezúttal nem nyert meg minden csatát. Megkértem mindkét botot, hogy hozzanak létre egy képet a cikkhez. A ChatGPT egy kissé hasznos képet készített, ami még mindig túl hamis, de a Nano Banana Pro egy számítógép által generált képpel törte meg a negyedik falat, amely egy agyat és egy ecsetet egy Apple iPad tetejére helyez. Más szóval – egyáltalán nem hasznos.
4. Vezetői küzdelmek Vezetői küzdelmek. A Gemini / Nano Banana a bal oldalon található John Brandon / Digital Trends
Használt felszólítás: Mutasson meg valakit, aki egy vezetési cél eléréséért küzd, de tegye azt igazán reálisnak
Az egyik leggyakoribb stockfotó, amelyet látni fog, azt mutatja, hogy valaki egy cél eléréséért küzd – például hegyet mászik, karját az ég felé emeli, vagy átugrik egy szakadékon. Ez a stock kép azért olyan népszerű, mert a fotók összehasonlíthatók – mindannyian küzdünk a sikerért. Azt mondanám, hogy a Nano Banana Pro és a ChatGPT is alulmaradt eredményeket produkált. Az általuk készített stock képeken valaki csalódottan látható egy irodában, gyűrött papírokkal. Ennek ellenére a Nano Banana valamivel valósághűbb megjelenésű.
5. Emilia Clarke mosolyogva a kamerába Emilia Clarke AI generált stock képet. A Gemini / Nano Banana a bal oldalon található John Brandon / Digital Trends
Használt prompt: Hozzon létre új stock képet, amelyen Emilia Clarke mosolyogva a kamerába néz az irodában
Egy utolsó teszthez megkértem mindkét robotot, hogy alkossanak egy új képet Emilia Clarke-ról, aki mosolyog a kamerába egy irodában. Meglepett, hogy a ChatGPT megtagadta a kép elkészítését, mondván, hogy Clarke „igazi, azonosítható személy”, míg a Nano Banana szívesen vállalta. Némi rábeszéléssel megkértem a ChatGPT-t, hogy hozzon létre valakit, aki úgy néz ki, mint Clarke. A Nano Banana kép valójában nem is olyan rossz – nem tűnik teljesen hamisnak.
Utolsó gondolatok
Az AI képalkotás hosszú utat tett meg. A Nano Banana Pro vagy a ChatGPT által készített fényképek egyikén sem volt látható valakinek hat ujja vagy három karja. Mind félig valósághűnek tűntek. Néhány Nano Banana kép elég valósághű volt ahhoz, hogy láthassam őket a közösségi médiában vagy más célokra, és a ChatGPT határozottan javul. Az én jóslatom? Jövőre ekkorra már nem fogjuk tudni különbséget tenni a valódi és a hamis fénykép között.









