Home Hír Az Adobe új mesterséges intelligencia a hangról szól. Hogyan készíts zenét videóidhoz...

Az Adobe új mesterséges intelligencia a hangról szól. Hogyan készíts zenét videóidhoz a Firefly segítségével

6
0

Az Adobe által a héten leadott hírek és termékfrissítések nagy része nem meglepő módon a generatív AI köré összpontosul. Míg azonban az idei év nagy részében hatalmas ugrások történtek a kép- és videógenerálás terén, az Adobe a mesterséges intelligencia kínálatának bővítésére összpontosít egy másik területen: az AI-audióban.

A két új funkció, a hangsáv és a beszéd létrehozása, pontosan azt teszik, amit a nevük sugall. Létrehozhat háttérzenét és forgatókönyvet rögzíthet a videójához. De mindegyikhez praktikus vezérlőelemek tartoznak, amelyek az AI-hangot kevésbé szerencsejátékká teszik, és hasznosabb eszközzé teszik minden képzettségi szintű alkotó számára. Már béta verzióban is elérhetőek.

Az Adobe kiadja legújabb, ötödik generációs Firefly Image Modeljének bétaverzióját is. Ígérek szerint jobb lesz a fotorealisztikus képek készítésében, és most már használhatja a prompt alapú szerkesztést. Van egy új béta Firefly videószerkesztő is, amely többsávos idővonallal rendelkezik, amely segít az AI által generált klipek összeállításában. Az Adobe két új mesterséges intelligencia-céggel, az ElevenLabs-szal és a Topaz Labs-szal is bővíti együttműködését. Még több AI hírért megtudhatja a AI asszisztensek jönnek a Photoshophoz és az Expresshez.

Íme egy példa arra, hogyan kell megírnia az AI zeneleírását.

Adobe Generáljon zenét és hangsávokat

A zeneengedélyezés bonyolult, különösen kereskedelmi felhasználás esetén. Tehát hadd kezdjem azzal a résszel, ami a legfontosabb: A Firefly által generált hangsávval generált minden zene univerzális licencet kap, ami azt jelenti, hogy bármilyen célra, korlátlanul felhasználhatod. Az Adobe mesterséges intelligencia-eszközeit olyan tartalom (jelen esetben hang) felhasználásával hozza létre, amelyet engedélye van az AI-oktatáshoz. Tehát elméletileg nem szabad eltávolítani a Firefly AI hangját a YouTube-ról vagy más platformokról, és nem kaphat rettegett szerzői jogi figyelmeztetést.

„Ez egy egyedülálló időszak a világon, amikor a zenei licencelés mindenki fejében jár, és az alkotók vagy csalódottak, mert a legjobbat próbálják kihozni a tartalomért, vagy össze vannak zavarodva” – mondta egy interjúban Jay LeBoeuf, az Adobe mesterséges intelligenciájának vezetője. „Szóval csak abban reménykedünk, hogy elhárítjuk a zavart.”

Egy demóban a Firefly visszautasította az előadó nevét tartalmazó felszólítást, mivel az szerzői jogi aggályok miatt megsértette a felhasználói irányelveit. Mivel a modellt nem képezték például Taylor Swift zenéjén, nem tud hozzá hasonló zenét alkotni.

Most pedig a mókás dolgok: A Soundtrack generálása az Adobe első mesterséges intelligenciális zenei eszköze, és úgy lett kialakítva, hogy megszabaduljon a találgatásoktól, amit akar. Feltöltöd a videódat, és a mesterséges intelligencia elemzi. Értékelése alapján a Firefly olyan felszólítást ír, amely szerinte jól használható a videódhoz. Ez egy Mad Libs-stílusú prompt, és tetszés szerint cserélheti a leírókat. A prompt három részből áll: az általános hangulat, a stílus (gondolkodó műfaj) és a cél (kereskedelmi, kísérleti stb.) leírása. Beállíthatja a tempót és az energiaszintet is.

Ha elégedett a felszólítással, kattintson a generálás gombra, és kevesebb mint két perccel később négy, csak hangszeres változatban játszhat. A hangja olyan hosszú lesz, mint a videóé, de szükség szerint szerkesztheti. Legfeljebb öt perces videókat tölthet fel.

Hogyan generáljunk zenét a Firefly segítségével

Most kipróbálhatod, hogyan készíthetsz mesterséges intelligencia hangszeres zenét videóidhoz. A hangsáv és a beszéd generálása egyaránt elérhető a Firefly-n keresztül, és béta állapotban vannak. Ellenőrizze, hogy Adobe-csomagja tartalmaz-e hozzáférést a Firefly-hez, és ha nem, szerezhet be egy csomagot havi 10 dollártól kezdve.

Nyissa meg a Firefly-t a weben.Kattintson a Generálás lehetőségre a bal oldali menüben.Kattintson a Hangsáv generálása a csevegőablak alatt elérhető kártyákból lehetőségre.Töltse fel videóját a bal oldali menü segítségével.A Firefly ezután elemzi a videót, és megfelelő felszólítást ír a bal oldali menübe. Ha nem tetszik, amit a Firefly kitalált, kattintson az „X” gombra, és írja be a kívánt promptot. Választhat a javasolt hangulatok, stílusok és célok közül is a bal oldali menüből. Görgessen le, és szükség szerint állítsa be az energiát, a tempót és az időtartamot. Kattintson a Generálás gombra.

Ha megvan a kívánt hangsáv, letöltheti a teljes videót (vagy csak a hangsávot) a számítógépére.

Ez egy példa négy zenei filmzenére, amelyeket Firefly készített egy mesterséges intelligencia-videóhoz, amelyet néhány emberről készítettem a tengerparton.

Képernyőkép: Katelyn Chedraoui/CNET Beszéd generálása

A beszéd előállítása a Fireflyben egyszerű, és számos olyan funkciót tartalmaz, amelyek szinte bármilyen projektben hasznosak lehetnek. Ez egy egyszerű ablak, ahová beírhatja azokat a szavakat, amelyeket az AI-hangnak fel kell olvasnia. Akár 7500 karakteres forgatókönyvet is feltölthetsz — nagyjából 15-20 perces videót. Feltöltés után 50 hang közül választhat, mindegyik hozzávetőleges kor és nem címkével, beleértve a nem bináris opciókat is. 20 különböző nyelven generálhat beszédet. De a móka az, hogy mit tehet a felszólítás finomhangolásához.

A beszéd több, mint szavak olvasása egy oldalon. Amikor hosszú részeket olvasunk vagy beszélgetünk másokkal, természetesen hangsúlyt, érzelmet és ritmust adunk a beszédünkhöz. Az új programmal ugyanezt megteheti: szüneteket ad hozzá ott, ahol azt szeretné, hogy az AI levegőt vegyen, és kiemelje azokat a részeket, ahol a hangszínnek el kell mozdulnia.

Ha olyan vagy, mint én, és senki sem ejti ki rögtön a nevedet az első próbálkozásra, használhatja a „kiejtés javítása” eszközt, hogy meggyőződjön arról, hogy ne forduljon elő zűrzavar. Válassza ki a nevet vagy tulajdonnevet, majd adjon hozzá fonetikai bontást, és az AI ezt fogja használni a kiejtés kiegyenlítésére.

Ezek az eszközök, valamint a konkrét szakaszok beállításának gyakorlati képessége, célja, hogy nagyobb irányítást biztosítson, amit más szövegfelolvasó programok nem mindig kínálnak.

„Ez egy módja annak, hogy élethű beszédet nyújtsunk az alkotóknak, a kisvállalkozások tulajdonosainak, az oktatóknak, mindenkinek, akinek tényleg csak el kell mesélnie egy történetet, és talán nem érzik magukat olyan kényelmesen, mint ahogy előhúzzuk a mikrofont és beszélgetünk” – mondta LeBoeuf.

A Firefly audio egy vadonatúj AI-modell. De nem ez az egyetlen lehetőség. Az Adobe ebben az évben folyamatosan bővíti a harmadik féltől származó mesterséges intelligencia modellek listáját, mind az AI videók, mind a képek tekintetében. Újra kibővíti ezeket a lehetőségeket azáltal, hogy az ElevenLab többnyelvű V2-modelljét beszédgenerálási lehetőségként tartalmazza.

További információért nézze meg hogyan működik az Adobe Project Indigo kameraalkalmazása, immár az iPhone 17 támogatásával.

Fuente de noticias