A CNET mesterséges intelligencia-kép- és videógenerátorok lektoraként a munka egyik legnagyobb előnye a mulatságosan rossz, vadul bizarr és időnként hátborzongató képek feltörése. generátor szerszámok kiköp.
Félreértés ne essék, az AI kreatív szoftverek rövid idő alatt nagy utat tettek meg. Gyönyörű sci-fi jeleneteket készítettem Midjourneyvalósághű megjelenésű termékképekkel Stabil diffúzió és a mesterséges intelligencia megalkotta magam azzal ChatGPT. De egyetlen AI-szolgáltatás sem tökéletes, és figyelemre méltó trendeket figyeltem meg a tesztelés során.
Vannak dolgok, amelyeket a folyamatos frissítések ellenére az AI képgenerátorok egyszerűen nem tudnak jól kezelni első próbálkozásra.
Egyes AI képprogramok eszközöket adnak ezeknek a hibáknak a szerkesztéséhez, ami nagyszerű. Nagyon ajánlom, hogy amikor csak lehet, használd ki őket. Azoknál a programoknál, amelyek nem kínálják ezeket az eszközöket, vagy ha ezek az eszközök nem oldják meg a problémát, akkor ezt a következő lépést kell tennie.
Tapasztalataim alapján összeállítottam a jól bevált tippjeimet az utasítások és beállítások módosításához a képek optimalizálása érdekében. További információért tekintse meg a legjobb AI képgenerátorok és útmutatónk hatékony AI képprompt írás.
10 fotó, amely megmutatja, mivel küzdenek leginkább az AI képgenerátorok
Az összes fénykép megtekintése Emberi arcok és kifejezések Katelyn Chedraoui a Canva Magic Media AI/CNET segítségével
A pontos arckifejezések folyamatosan kihívás elé állítják az AI-generátorokat. A furcsa szemek, fogak és szemöldökök a legerősebb mutatói annak, hogy egy kép mesterséges intelligencia által generált. Ebben az esetben számomra rendkívül vicces volt az eredmény, ha teljesen használhatatlan is. A lányok halloween-szerű vámpírfogat viselnek, a hátul ülő csávónak pedig több, mint rossz hajnapja van.
Stephen Shankland a Blind Blind 3/CNET-en keresztül
A generátorok még rajzfilmes vagy nem valósághű karakterek esetén is küzdenek az érzelmek és kifejezések mérséklésével. Ez a kép – amelyet legjobb választásunk, a Dall-E 3 készített – túlzottan felerősítette a felszólítást, és a végeredmény túl drámai lett. Önmagamnak beazonosított ügyes őrült vagyok, de nem tudom elképzelni, hogy bárki is ennyire ideges legyen a több száz dolláros tisztítószer miatt. Még a legjobb programok is meghiúsulhatnak, és rossz eredményeket produkálhatnak.
Javítás: azt javaslom, hogy kérje meg a szolgáltatást, hogy csökkentse a megjeleníteni kívánt személyek számát – ezzel csökkentve a hibalehetőséget –, és használja a generálás utáni szerkesztőeszközöket a kép egyes részeinek kiválasztásához, amelyeket újra kell generálni vagy javítani kell. Egy enyhébb jelző kiválasztása („dühös” helyett „dühös”) segíthet a szolgáltatás helyes útra terelésében.
Ikonikus karakterek, védjegyek és felismerhető logók Katelyn Chedraoui a Canva Magic Media AI/CNET segítségével
Számos okból kifolyólag az AI képgenerátorok ritkán tudnak pontos logókat, ismert védjegyeket vagy más módon felismerhető karaktereket előállítani. Ennek általában az az oka, hogy jelentős jogi aggályok merülnek fel azzal kapcsolatban, hogy egy vállalat engedélyezi márkaanyagainak vagy szellemi tulajdonának AI-szolgáltatásokhoz való felhasználását. Ez azért is lehet, mert a felvenni kívánt logó vagy márka nem szerepel a generátor betanítási adatai között, így a generátor nem fogja megérteni a kérést.
Ez alól a közelmúltban két kivételt az új képgenerálási funkciók jelentik Google Pixel 9 és Pixel 9 XLköszönhetően a Gemini AI-nek, amelyet mobilszakértőink szoktak használni képeket készíteni Mickey egér és Pikachu pontos megjelenésű alakításaival. A másik kivétel néhány fizető X (korábban Twitter) felhasználó arról számol be, hogy használhatja a közösségi oldal Grok chatbotját valósághű megjelenésű Mickeys és emberi politikai személyiségek. Ezek a képek még mindig nem tökéletesek, de nagyon közel állnak hozzá.
Javítás: Nem teheti meg, de az a pozitív oldal, hogy sokkal nagyobb valószínűséggel kerüli el a szerzői jogok megsértése miatt indított pereket. Ha ezzel a problémával találkozik, azt javaslom, hogy tekintse át újra a tervezési koncepcióját, és nézze meg, vajon át tudja-e érni ugyanazt a gondolatot konkrét cégnév vagy logó használata nélkül. Valóban szükséged van a TikTok logóra, vagy csak egy telefonra van szükséged, amelyen például függőleges videólejátszás van.
Átfedő, összetett elemek Katelyn Chedraoui a Leonardo AI/CNET segítségével
Alkalmanként elakad egy generátor, ha túl sok átfedő vagy összetett elem van egy képen. A legjobb mesterséges intelligencia képalkotó programok nem gyakran ütköznek ebbe a problémába, de még a legjobb programok is meghibásodnak valamikor. Ezzel a Leonardo-képpel álmaim könyvtárát teszi tönkre a félúton eltűnő gördülő létra.
Katelyn Chedraoui a Canva Magic Media AI/CNET-en keresztül
Hasonlóan, a konyhának ez a fotorealisztikus képe felületes pillantásból jól néz ki, de egy második pillantásra vagy egy gyors nagyításra értelmetlen karakterek jelennek meg a szakácskönyvre nyomtatva, és maga a könyv két gerincből és három részből áll. Az ehhez hasonló képek megmutatják, mennyire frusztráló tud lenni az AI-képek készítése – még akkor is, ha úgy gondolja, hogy nyert, az apró hibák használhatatlanná teszik őket.
Javítás: Próbálja meg egyszerűsíteni a felszólítást, vagy használjon utólagos szerkesztőeszközöket a probléma kiemeléséhez és kijavításához. Néha az esztétika megváltoztatása is segíthet; ezek a problémák általában akkor jelentkeznek, amikor fotórealisztikus vagy stock képeket próbál készíteni. Ha szolgáltatása egy adott területszerkesztő eszközt kínál, próbálja meg ezzel kiválasztani a kérdéses területet, és kérje meg a generátort, hogy távolítsa el a benne lévő elemeket.
Túlszerkesztés és hallucinációk Katelyn Chedraoui a Midjourney AI/CNET segítségével
A nagyszerű mesterséges intelligencia-képgenerátor jele, hogy képes kevés hibával vagy hallucinációval rendelkező képet készíteni, miközben megfelelő eszközöket biztosít a problémák megoldásához, amikor elkerülhetetlenül felbukkannak, de nem minden szolgáltatás teszi ezt. Ebben a Midjourney példában több körben szerkesztettem ezt a győzelmet ünneplő futballcsapatot ábrázoló képet, és fogalmam sincs, mi történt a végeredményig – vagy fogalmam sincs, mi történik azzal a folttal, amely feltehetően egy játékos a kép jobb oldalán. Őszintén szólva szerintem Midjourney sem tudta.
Javítás: A mesterséges intelligencia képek szerkesztésével a kevesebb néha több. Ne féljen letörölni az aktuális képcsomagot, és kezdje elölről. A nagy problémákat gyakran megelőzően kijavíthatja a felszólítás finomításával, így csak a kisebb problémák későbbi kijavítása miatt kell aggódnia.
Az AI-generátoroknak továbbra is emberi munkára van szükségük, Katelyn Chedraoui a Leonardo AI/CNET segítségével
Nincs kétségem afelől, hogy az AI-generátorok mögött álló cégek azon dolgoznak, hogy kiküszöböljék ezeket a problémákat, és szintre emeljék modelljeik. Egyelőre a tökéletlen képek ismét megmutatják, hogy bár ez a technológia fejlődik, mégsem hibátlan. Remélem, hogy mivel e szolgáltatások közül oly sok hasonló kihívással néz szembe, mindegyik megoldást keres ezekre a problémákra.
Utolsó megjegyzésként emlékeztetni szeretném Önt arra, hogy a megosztáskor bevált gyakorlat, ha egy képet MI-generáltak jóváírni vagy elismerni. Ahogy a mesterséges intelligencia képek egyre jobbak és valósághűbbé válnak, minden eddiginél fontosabb megkülönböztetni a mesterséges intelligencia által generált művészetet a többi médiától.
További információért tekintse meg tanácsainkat a legjobb AI képprompt megírása és a legjobb választásunk AI képgenerátorok.









