Google generatív AI A filmkészítési program Flow elérte a mérföldkövet. A technológiai óriás kizárólag a CNET -nek erősítette meg, hogy a Flow Creators több mint 100 millió AI videót készített a programban. Részben a fejlett AI video modellnek, Látom 3A Flow lehetővé teszi a felhasználók számára, hogy videoklipeket generáljanak, és együtt szerkesztsék őket a jelenetek létrehozásához.
90 nap telt el, mióta a Google meglepte minket az áramlással Éves I/O fejlesztői konferencia– Elias Roman, a Google Labs Flow termékmenedzsmentének vezető igazgatója szerint azóta azóta „csak azért, hogy lépést tartson a kereslettel”.
A Flow eltérés a Google korábbi generációs AI -munkájától. A vállalat AI erőfeszítései évek óta összpontosítanak Ikrekaz összes-egy chatbot. Elárasztotta termékeit az AI -vel, például A keresés AI áttekintései és a Gmail AI által generált összefoglalók. Kutatási asszisztens eszköze, NotebookLMAz AI audio generátorával, amely a dokumentumokat személyes podcastokká alakítja, folyamatosan új funkciókat mutat be.
Az iparág vezetője milliárd dollárt költött arra, hogy megpróbálta megnyerni a versenyt a legfejlettebb AI fejlesztésére az átlagos Google -keresők, fejlesztők és igen, még a művészek és az alkotók számára is. A 100 millió AI videó jelentős mérföldkő a vállalat számára, és segít megmutatni nekünk, hogy nézhet ki az AI-kompatibilis létrehozás jövője.
Belépés az AI -áramlásba
Hogy versenyezzen MidJourney és Stabil diffúzióA Google létrehozta az AI képmodellek termését, amelyet eredetileg elneveztek ImageFx És ma immen néven ismert (kiejtve „képzel”). Korábbi generációs médiamodellei jobban alkalmasak voltak amatőr vagy rajongók alkotói számára, nem pedig a szakemberek számára, és nem uralták az AI kreatív teret. Ez mind megváltozott a Veo 3 -val.
A Google eldobta a Veo 3 -at, a legújabb AI video modellt, a május I/O konferenciáján. A Veo 3 egy kissé nyilvánvaló, de az iparágban előrelépéssel ugrott a versenyre: AI videók szinkronizált, AI-generált audio-val. A modell rengeteg figyelmet kapott az interneten, és a Google beszámolt Több mint 40 millió AI videó Csak hét héttel később.
„Amit a Veo 3 megengedett, sokkal szélesebb körű emberkészlet volt, hogy nagyon lenyűgöző videókat készítsen, és az összes érzéket kihúzza a dobozból. Nem kellett összeraknia egy eszközkészletet” – mondta Roman. „Ahhoz, hogy meg tudjuk csinálni a Foley (környezeti hangok), a hanghatások, a hangzás, a párbeszédpanel, mindezt, és azt hiszem, hogy a felhasználó mindegyike mindegyik módjáról gondolkodik, azt hiszem, szintén nagy feloldás.”
A Veo 3 egyike annak a több AI modellnek, amelyet a Filmmaker eszközben használhat. A Flow -t a professzionális alkotók és a filmkészítők számára építették, egy lépéssel túl az egyszerű imázs és videó generáción túl, amely a Gemini -vel elérhető. A Google szándékosan elmozdult az eredeti ImageFX nómenklatúrától, és felépítette az interfészét – mondta Roman, és azt akarta, hogy a legfejlettebb Imagen és Veo modellek kombinálják a Gemini -t, amelyet a Veo edzéséhez használtak, és „alapvetően beszél a natív Veo”.
A Flow az egyik módja annak, hogy összekapcsoljuk az összes AI modellt és darabot, egyesítve a Google különféle generatív AI modelljeit a zökkenőmentes videó létrehozásához és szerkesztéséhez.
Mi különbözteti meg az áramlást a Veo -tól és az Imagen -től
Az áramlást úgy építették fel, hogy a konzisztenciára, azaz a vizuális identitás fenntartására összpontosítson az egyik klipről a másikra. Ha van egy 90 másodperces videója arról, hogy a karaktered kávét iszik egy kávézóban, akkor nem akarja, hogy a hajhossz vagy a szem színe 8 másodpercenként változjon a jelenetek között. Ez a konzisztencia fontos a szakmai projektek számára, és ezt is nehéz elérni. Roman „Achilles Ai videó” -nak hívta.
A Flow -nak számos olyan eszköze van, amelyek segítenek fenntartani ezt a konzisztenciát, és a tesztelésem során új szintű ellenőrzést adnak a munkájának felett, amely korábban hiányzott a Google AI eszközeiből. A legjobb módszer, amellyel leírom az áramlást, az egyszerű videógenerátor interfészek kiemelkedő verziója, azzal a lehetőséggel, hogy több klipet exportáljon a Premiere pro-szerű idővonal egyszerűsített verziójába.
Az AI eszközöket gyakran frissítik azzal a reménytel, hogy hasznosabbá válnak a profi alkotók számára, bár a célközönség nem vonzza automatikusan azok használatát. A generatív AI a vitatott kérdés A kreatív iparágakban, különösen a szöveg, a kép és a videó nagykereskedelmi létrehozásakor. Az AI rajongók az AI modellek kreativitását és sebességét kelthetik, de az alkotók továbbra is folytatják Hang legitim aggodalmak arról, hogy az AI hogyan képzett és telepítve van. Ez az oka annak, hogy a kiadók és a művészek pert indítottak az AI -társaságok ellen A szerzői jogok megsértésének állítása– Ez az oka annak, hogy az adatgazdagok munkavállalói a munkabiztonsági aggályokkal szembesülnek, mivel a vezetők a költségek csökkentésére törekszenek.
Az AI másik problémája az, hogy az a kép, amelyet létrehozhat. Tavaly a felhasználók találtak Ikreket képeket tudott előállítani színes emberek száma a náci katona egyenruhában. A Google elnézést kért, amit a társaságnak „pontatlanságnak hívtak néhány történelmi képgenerációs ábrázolásban” és említett Arra törekedett, hogy azonnal javítsa ezeket a ábrázolásokat.
(A Google irányelvei megtilt A visszaélésszerű és illegális AI tartalom létrehozása. Roman elmondta, hogy a biztonsági politikájának végrehajtásának javítását a technológiai frissítések, valamint a valós felhasználás és a jelentések segítik.)
A továbblépéssel Roman azt mondta, hogy a Flow a Veo 3 képességeinek bővítésén, a következetesség javításán és az új funkciók hozzáadásán dolgozik, mint például a karaktermunka testreszabott hangjai. A projekt északi sztárja a teremtést jobban hozzáférhetővé teszi az emberek számára.
„Csökkenthetjük azokat az akadályokat, amelyek megakadályozzák a sokkal szélesebb körű emberek sorozatát, hogy videókat meséljenek el, és felvehetjük a mennyezetet, hogy milyen történeteket lehet elmondani videó révén” – mondta Roman. „Néhányuk vicces és ostoba lesz, mint például a vad utcai interjúk vagy a Yeti ASMR bloggerek, és mások nagyon erősek lesznek.”
Hogyan lehet használni a Google Flow -ját AI videókhoz
A Flow, amely a Google Labs része és az AI tesztkonyháján keresztül elérhető, a fizetéshez elérhető Google AI Az előfizetők havi 20 dolláros Pro tervében és havonta 250 dollár ultra -tervben (jelenleg három hónapig 125 dollárért kedvezményt kaptak). Google Labs’s adatvédelmi értesítés azt mondja, hogy „az emberi értékelők olvasnak, kommentálnak és feldolgoznak” a laboratóriumok interakciói és szerszámkibocsátásait az AI modellek javítása érdekében. (Az Ön Labs -adatait alapértelmezés szerint akár 18 hónapig tárolja, és a vállalat azt tanácsolja, hogy ne töltse fel vagy nyújtsa be bizalmas információkat. A Google Általános Adatvédelmi Központja több információja van.)
Időt töltöttem az áramlás tesztelésével, klipek generálásával és a jelenetcsomaggal történő összevarrással. Számos eszköz csak a Flow felhasználók számára érhető el.
Összetevők-videó: Van néhány módja annak, hogy videoklipeket generáljon, beleértve az önmagát magyarázó szöveg-videót és a kép/képkocka-videót. Az összetevők-video-videó új, érdemes felfedezni. Ezzel a módszerrel feltölti a konkrét képeket, és hozzáad egy szöveges promptot, és az áramlás összevonja az alkatrészeket. Például feltölthet egy képet egy emberről, egy adott kabát termékfotójáról és egy festői háttérről, majd a Flow kombinálhatja és animálhatja a videót.
A klipek kiterjesztése és az átmenetek simítása: A kiterjesztés segíthet a klipek meghosszabbításában. A SceneBuilder ütemtervében húzza ki az egyik klip keretének végét a kívánt hosszúságra. Ha új videót készít, és sima átmenetet szeretne, azt javaslom, hogy menjen az első klip végére, és nyomja meg a jelölő tetején lévő plusz gombot, hogy a végső keretet a könyvtárba mentse. Ezután használhatja ezt a képet egy képkocka-videó-kérésben, hogy fenntartsa ezt a konzisztenciát a kliptől a klipig.
Doodling és szerkesztések készítése: Ha egy keretet vagy képet külön dokumentumban szerkeszt, feltöltheti a megjelölt képet az áramláshoz, és utasíthatja a modellt a változások megvalósításához. Ezt megteheti olyan képekkel is, amelyekre rajzolt, és ez életre keltheti ezeket a doodlákat. Ez egy fejlődő szolgáltatás – egy új prototípus erre a munkákban -, de határozottan szórakoztató, ha az áramlás képességeit ilyen módon nyújtják.
Felhívás az Ikrekkel: Nincs mód arra, hogy az Ikrek automatikusan létrehozzák és/vagy javítsák a felszólításokat közvetlenül a Flow -ban (remélem, hogy megváltozik a jövőbeli frissítés), de a chatbot segítségével segíthet a tökéletes prompt elkészítéséhez. Ha arra törekszik, hogy részletesebben orientált ötleteket hozzon életre, próbálja meg hagyni, hogy az Ikrek segítsen.
További információkért nézze meg a A Top AI képgenerátorok és a Útmutató a legjobb AI -képek írásához–