Home Hír Az AI-videó- ​​vagy képmodell „személyiségének” elsajátítása az új kreatív munka

Az AI-videó- ​​vagy képmodell „személyiségének” elsajátítása az új kreatív munka

7
0

A mesterséges intelligencia kép- és videómodellei nem emberek, de az őket használó alkotók szerint külön „személyiségük” van. Az új jelenség a gyorsan bővülő generatív mesterségesintelligencia-iparra adott reakció, rávilágítva arra, hogyan kezelik az alkotók szédítően sok választási lehetőséget.

A generatív mesterséges intelligencia az elmúlt néhány évben hatalmas növekedést tapasztalt, de ez csak 2025-ben történt. AI kép, videó és más generatív médiamodellek kerültek a középpontba. Ahogyan a chatbotok újradefiniálták a szöveggenerálást, ezek a kreatív AI-modellek is átalakítják a tartalomalkotást és a kreatív munkát, jó vagy rossz irányba.

A Google és az OpenAI régóta vezető szerepet tölt be az AI-versenyben. Ez év előtt arról voltak ismertek Ikrek és ChatGPT chatbotok. Jelenleg, látom 3, nano banán és Sora 2 szilárdan a technológiai titánokat helyezték a csapat élére a kreatív AI-modellek között. Új mesterséges intelligencia innovációk innen Vályogtégla és az AI kreatív induló vállalkozások, mint pl KifutópályaPika és Luma is megerősítette a mezőnyt ebben az évben.

Ahhoz, hogy az AI-cégek versenyképesek maradhassanak a zsúfolt piacon, a generatív média réskínálatból elengedhetetlen szükségletté fejlődött. A vállalatok a mesterséges intelligencia modelljeik frissítésére összpontosítanak, hogy megőrizzék előnyüket és új felhasználókat vonzanak magukhoz. A fejlesztések jellemzően olyan részletgazdag, nagyobb felbontású tartalom létrehozását jelentik, amely videó esetén hangot is tartalmaz, és meghosszabbítja a klipek időtartamát. A hallucinációk vagy hibák minden modellfrissítéssel eltűnnek, ezért is válik egyre nehezebbé hogy észrevegyék az AI által generált tartalmat.

Összességében még soha nem volt ennyi lehetőség AI-tartalom létrehozására. Amikor az alkotóknak ki kell választaniuk a használni kívánt modellt, már nem az a lényeg, hogy melyik modell hoz használható eredményeket. Most arról folyik a vita, hogy melyik lesz a legmegfelelőbb egy adott projekthez vagy feladathoz. Ennek eredményeképpen minden mesterséges intelligencia modellnek megvan a maga személyisége.

Ne hagyja ki elfogulatlan műszaki tartalmainkat és laboratóriumi értékeléseinket sem. Adja hozzá a CNET-t preferált Google-forrásként.

Az AI-eszközök humanizálása személyiségekkel

Az alkotók a „személyiségek” kifejezést használják köznyelvben – az AI-modellek nem emberek, ezért nincs személyiségük. A kifejezés valójában egy modell azon képességére utal, hogy képes kezelni bizonyos feladatokat, és arra a hírnevére utal, hogy bizonyos területeken kiváló. Ez az egyes modellek egyedi stílusára is utal az alapvonalon.

„Az alkotók humanizálják ezeket az eszközöket. „Kreatívnak” vagy „részletesnek” hívják őket, mert tényleges kapcsolatokat építenek ki mesterséges intelligenciájukkal. Ez már nem csak szoftver” – mondta Tiffany Kyazze (@TechTiff), alapítója a AI Flow Clubamely megtanítja az embereket az AI-eszközök használatára. „Ezek a személyiségek segítenek az alkotóknak abban, hogy bizalmat építsenek eszközeikkel, átdolgozzák a kreatív blokkokat, és megtalálják a kényelmes munkafolyamatot.”

Az AI-eszközöket naponta használó alkotók számára a megfelelő modell kiválasztása a kreatív folyamat szerves részévé vált, akárcsak a megfelelő kameralencse vagy ecset kiválasztása.

„Minden modell másként értelmezi a világot; egyesek filmszerűek, mások szürreálisabbak vagy álomszerűbbek” – mondta David Clarkigazgatója és kreatív igazgatója at Az AI ígériegy AI produkciós stúdió. „Számomra a kulcs az, hogy tudjam, hogyan kell átvenni a kreatív elképzelésemet, és azt vizuális nyelvi sugalmakra fordítani, amelyek lehetővé teszik számomra, hogy elérjem azt a művészetet, amit szeretnék.”

Minden modell személyiségének felfedezéséhez van egy tanulási görbe. Néha nem is az azt létrehozó cég határozza meg; képek és videók, valamint ugyanazon modell különböző generációi között változik. Ennek egy része a modellek létrehozásának köszönhető.

„A saját modelljeink betanítása során tanulunk egy része a képzési folyamat végén, meg lehet mutatni a modellnek egy bizonyos stílust, és a modell bizonyos mértékig túlilleszkedik, vagy alkalmazkodik ehhez a stílushoz, és alapvetően személyiséget nyer” – mondta Alexandru Costin, az Adobe generatív AI alelnöke. „Tehát nagyon jó véleményű modelleket látunk, akik ezt teszik. Mások megpróbálnak semlegesebbek lenni.”

A modell létrehozásához és finomításához használt betanítási adatok szintén szerepet játszanak az egyes modellek alapstílusának kialakításában. Például az Adobe Firefly modelljeit licencelt Adobe Stock képekkel képezték ki, ezért a Firefly által generált tartalom gyakran állományszerű megjelenésű. (Costin elmondta, hogy a cég dolgozik a probléma megoldásán, hogy reálisabb eredményeket hozzon létre.)

Mi az egyes AI kép- és videómodellek személyisége?

Sok időt töltöttem ezekkel a mesterséges intelligencia modellekkel, és az alkotóknak, akikkel beszélgettem, hasonló ötleteik és tapasztalataik voltak, mint az enyém, amikor az egyes modellek személyiségéről volt szó. Íme néhány a legnépszerűbb modell személyiségei közül.

A Google Veo 3 (videó): Moziszerű, természetes mozgás, kiváló minőségFluxus (videó): Realizmusban kiváló, különösen az emberi tulajdonságok tekintetében Kifutópálya (videó): Teljesen kreatív stúdió, nagyszerű azok számára, akiknek gyakorlati irányításra van szükségükSora (videó): Jó ötletekhez és felfedezéshez, mémek Sora közösségi média alkalmazásMidjourney (kép és videó): A legtöbb kreatív modell, a legjobb művészi vagy stilizált munkákhoz Google nano banán (kép): Legjobb a karakterek konzisztenciájához, jó az e-kereskedelemhez és a közösségi médiában végzett munkáhozAdobe Firefly Image Model 5 (kép): Kereskedelmileg biztonságos eredmények professzionális munkához

A chatbotok között is észrevehet majd különböző személyiségeket. A ChatGPT szeretetteljes, szimpatikus hangneméről ismert (néha bosszantóan úgy), míg a Claude egy gyakori kutatási eszköz, a Gemini pedig kényelmes választás a Google-felhasználók számára. Azonban a mesterséges intelligencia kép- és videómodelleinek különböző személyiségei – stílusok, esztétikák, veleszületett preferenciák stb. – sokkal nyilvánvalóbbak.

Bár szinte bármilyen jelenetet létrehozhat az AI kép- és videógenerátorokkal, ezek nem olyan „minden gépek”, mint a chatbotok. Az AI kreatív eszközöket professzionális munkához használó alkotóknak gyakran meg kell hagyniuk egy adott tartalommal. Az egyes modellek személyiségének megértése kulcsfontosságú.

Több modell használatának előnyei

Az AI-modellek és -programok közötti ugrálás gondolata elsőre talán nem tűnik vonzónak, de az AI névsorának bővítése előnyei is vannak.

Clark és csapata különféle mesterséges intelligencia-modellt használt egy új modellhez kisfilm ő rendezte a Barátom, Zeph. A hibrid filmkészítés e módszere, ahogy Clark nevezi, a csapat olyan mesterséges intelligencia eszközöket használt, mint az Adobe Firefly, a Google Veo 3.1 és a Luma’s Ray3, valamint az Adobe hagyományos szoftverei, köztük a Photoshop és a Premiere Pro.

„Több modell összekeverésével kreatív tartományt és pontosságot érhet el, mintha egy szakértői csapat lenne” – mondta Clark. „Sokkal korábban vizualizálhatjuk a történet világát, gyorsabban iterálhatunk, és erősebb kreatív döntéseket hozhatunk, mielőtt a forgatásra lépnénk.”

Egyes alkotók hűségesek bizonyos mesterségesintelligencia-eszközökhöz és -platformokhoz, és esetleg haboznak kibontakozni. A mesterséges intelligencia hűségéről szóló elképzelés kissé téves, mondta Kyazze. A legjobb eredményeket elérő alkotók „eszköz-agnosztikusak és célközpontúak”.

„A többmodelles munkafolyamatok valódi előnye, hogy nem kényszerít mindenre egy eszközt. Kiaknázza az egyes modellek tényleges erősségeit. Ez nem csak hatékonyabb. Jobb eredményeket ér el, mert a megfelelő eszközt használja a projekt minden egyes részéhez” – mondta Kyazze.

Fejlődő személyiségek

A személyiséggel rendelkező mesterséges intelligencia modellek koncepciója viszonylag új, köszönhetően az alkotók számára elérhető modellek számának közelmúltbeli felfutásának. De ezek nem statikus címkék; a modell hírneve és személyisége idővel változhat. Ahogy az új frissítések megjelennek, a korábban egy bizonyos feladathoz szörnyűségről ismert modellek továbbfejleszthetők.

Ez a tendencia egy újabb jele annak, hogy a mesterséges intelligencia egyre nagyobb szerepet játszik a kreatív munkában. Ez nem minden alkotóra igaz, mivel sokan vannak, akik ellenzik az AI-t, és nem akarják használni. De akit érdekel, soha nem volt több választási lehetőség.

A mesterséges intelligencia kép- és videómodelljeihez különálló személyiségek létrehozása az egyik módja vagy megoldása annak, hogy segítsünk nekik kiválasztani a megfelelő eszközt a jobb eredmények eléréséhez – anélkül, hogy túl sok időt és pénzt pazarolnának a nem a legjobban illeszkedő AI-eszközökre.

Bár a generatív médiamodellek sokat fejlődtek, még mindig nem tökéletesek. Az egyes modellek erősségeihez és gyengeségeihez való alkalmazkodás egy intelligens munkafolyamat-tervezés, mondta Kyazze. Az is fontos, hogy ne feledjük, hogy az AI-modellek csak eszközök – mondta Clark.

„A művész emberi megnyilvánulása – személyiségünk és kreatív nézőpontunk – az, ami valóban vezérli az eredményeket” – mondta Clark. „Nem a hagyományos folyamat felváltásáról van szó, hanem a lehetséges lehetőségek kibővítéséről és a képzelet minden eddiginél közelebb hozása a képernyőhöz.”

(Közzététel: A Ziff Davis, a CNET anyavállalata áprilisban pert indított az OpenAI ellen, azt állítva, hogy megsértette a Ziff Davis szerzői jogait az AI-rendszerek képzése és üzemeltetése során.)

Fuente de noticias