Home Hír Az Adobe felerősíti a mesterséges intelligencia hangerejét új módszerekkel a hangsávok és...

Az Adobe felerősíti a mesterséges intelligencia hangerejét új módszerekkel a hangsávok és hangok generálására

3
0

Az Adobe mesterséges intelligencia központja, a Firefly központi szerepet játszik a legújabb innovációkban. A vállalat rengeteg mesterségesintelligencia-alapú frissítést jelentett be keddi Max kreatív konferenciáján. Miközben a többiek megszállottan (és aggasztó) OpenAI felett új Sora AI-slop alkalmazásAz Adobe más irányba tart: legújabb funkciói az AI-hang generálására szolgálnak.

Az Adobe volt a második nagy technológiai vállalat bevezetni az AI által generált hangot AI videomodelljéhez, a Google Veo 3-at követve. Korábbi AI audioeszköze elsősorban a hangeffektusokra összpontosított. Ezzel az eszközzel rögzítheti magát, ahogy egy szörnyetegként ordít, és a mesterséges intelligencia megtartja a felvétel ütemét, de megerősíti az AI-val. Az Adobe most az audioeszközeire épít, és újakat vezet be.

Hangsáv generálása és beszéd generálása pontosan azt tegye, amit javasolnak: Létrehozhat háttérzenét és rögzíthet forgatókönyveket a videójához. De mindegyikhez tartoznak az iparág elsőbbségei, amelyek minden alkotó számára csábítóvá teszik. Már béta verzióban is elérhetőek.

Az Adobe is kiadja legújabb, ötödik generációs Firefly Image Modeljét. Jobban képes fotórealisztikus képeket készíteni, és most már használhatja a prompt-alapú szerkesztést. Van egy új Firefly videószerkesztő is, egy többsávos idővonal, amely az AI által generált klipek kezelését hivatott segíteni. Az Adobe két új AI-céggel, az ElevenLabs-szal és a Topaz Labs-szal bővíti együttműködését. Az Adobe segítségével pedig saját egyéni AI-modelleket is létrehozhat. Még több AI hírért megtudhatja a AI asszisztensek jönnek a Photoshophoz és az Expresshez.

Beszéd generálása

A beszéd előállítása a Fireflyben egyszerű, és számos olyan funkciót tartalmaz, amelyek szinte bármilyen projektben hasznosak lehetnek. Ez egy egyszerű ablak, ahová beírhatja azokat a szavakat, amelyeket az AI-hangnak fel kell olvasnia. Akár 7500 karakteres forgatókönyvet is feltölthetsz — nagyjából 15-20 perces videót. Feltöltés után 50 hang közül választhat, mindegyik hozzávetőleges kor és nem címkével, beleértve a nem bináris opciókat is. 20 különböző nyelven generálhat beszédet. De a móka az, hogy mit tehet a felszólítás finomhangolásához.

A beszéd több, mint szavak olvasása egy oldalon. Amikor hosszú részeket olvasunk vagy beszélgetünk másokkal, természetesen hangsúlyt, érzelmet és ritmust adunk a beszédünkhöz. Az új programmal ugyanezt megteheti: szüneteket ad hozzá ott, ahol azt szeretné, hogy az AI levegőt vegyen, és kiemelje azokat a részeket, ahol a hangszínnek el kell mozdulnia.

Ha olyan vagy, mint én, és senki sem ejti ki rögtön a nevedet az első próbálkozásra, használhatja a „kiejtés javítása” eszközt, hogy meggyőződjön arról, hogy ne forduljon elő zűrzavar. Válassza ki a nevet vagy tulajdonnevet, majd adjon hozzá fonetikai bontást, és az AI ezt fogja használni a kiejtés kiegyenlítésére.

Ezek az eszközök, valamint a konkrét szakaszok beállításának gyakorlati képessége, célja, hogy nagyobb irányítást biztosítson, amit más szövegfelolvasó programok nem mindig kínálnak.

„Ez egy mód arra, hogy élethű beszédet nyújtsunk az alkotóknak, a kisvállalkozások tulajdonosainak, az oktatóknak, mindenkinek, akinek tényleg csak el kell mesélnie egy történetet, és talán nem érzik magukat olyan kényelmesen, mint amikor előhúzzuk a mikrofont és beszélgetünk” – mondta egy interjúban Jay LeBoeuf, az Adobe mesterséges intelligencia hangért felelős vezetője.

A Firefly audio egy vadonatúj AI-modell. De nem ez az egyetlen lehetőség. Az Adobe ebben az évben folyamatosan bővíti a harmadik féltől származó mesterséges intelligencia modellek listáját, mind az AI videók, mind a képek tekintetében. Újra kibővíti ezeket a lehetőségeket azáltal, hogy az ElevenLab többnyelvű V2-modelljét beszédgenerálási lehetőségként tartalmazza.

Íme egy példa arra, hogyan kell megírnia az AI zeneleírását.

Adobe Generáljon zenét és hangsávokat

A zeneengedélyezés bonyolult, különösen kereskedelmi felhasználás esetén. Tehát hadd kezdjem azzal a résszel, ami a legfontosabb: A Firefly által generált hangsávval generált minden zene univerzális licencet kap, ami azt jelenti, hogy bármilyen célra, korlátlanul felhasználhatod. Az Adobe mesterséges intelligencia-eszközeit olyan tartalom (jelen esetben hang) felhasználásával hozza létre, amelyet engedélye van az AI-oktatáshoz. Tehát elméletileg nem szabad eltávolítani a Firefly AI hangját a YouTube-ról vagy más platformokról, és nem kaphat rettegett szerzői jogi figyelmeztetést.

„Ez egy egyedülálló időszak a világon, amikor a zenei licencelés mindenki fejében jár, és az alkotók vagy csalódottak, mert a legjobbat próbálják kihozni a tartalomért, vagy össze vannak zavarodva” – mondta LeBoeuf. „Szóval csak abban reménykedünk, hogy elhárítjuk a zavart.”

Egy demóban a Firefly visszautasította az előadó nevét tartalmazó felszólítást, mivel az szerzői jogi aggályok miatt megsértette a felhasználói irányelveit. Mivel a modellt nem képezték például Taylor Swift zenéjén, nem tud hozzá hasonló zenét alkotni.

Most pedig a mókás dolgok: A Soundtrack generálása az Adobe első mesterséges intelligencia zenei eszköze, és úgy lett kialakítva, hogy megszabaduljon a találgatásoktól, amit akar. Feltöltöd a videódat, és a mesterséges intelligencia elemzi. Értékelése alapján a Firefly olyan felszólítást ír, amely szerinte jól használható a videódhoz. Ez egy Mad Libs-stílusú prompt, és tetszés szerint cserélheti a leírókat. A prompt három részből áll: az általános hangulat, a stílus (gondolkodó műfaj) és a cél (kereskedelmi, kísérleti stb.) leírása. Beállíthatja a tempót és az energiaszintet is.

Ha elégedett a felszólítással, kattintson a generálás gombra, és kevesebb, mint két perccel később négy zenei variáció készen áll a lejátszásra. A hangja olyan hosszú lesz, mint a videóé, de szükség szerint szerkesztheti. Legfeljebb öt perces videókat tölthet fel.

További információért nézze meg hogyan működik az Adobe Project Indigo kameraalkalmazása, immár az iPhone 17 támogatásával.

Fuente de noticias