Home Hír Fizessen fel, AI BOT: Ez egy kulcsfontosságú cég üzenete az internet működésében

Fizessen fel, AI BOT: Ez egy kulcsfontosságú cég üzenete az internet működésében

5
0

Az AI -társaságok számára nehezebb lehet elérni a teljes internetet, hogy nagy nyelvű modelljeiket kiképzzük, miután az internetes infrastruktúra -szolgáltató, a CloudFlare azt mondta, hogy ezen a héten alapértelmezés szerint blokkolja az AI adatrögzítőit.

Ez a legújabb front, amely a tartalom alkotói és az AI fejlesztők közötti folyamatos küzdelemben nyílik meg, akik ezt a tartalmat a generatív AI modellek kiképzésére használják. A bíróságon a szerzők és a tartalom készítői beperelnek a nagy AI társaságok kompenzációját, mondván, hogy a szerzői joggal védett tartalmat engedély nélkül használják. (Nyilvánosság: Ziff Davis, a CNET anyavállalata áprilisban pert indított az Openai ellen, állítva, hogy megsértette a ZIFF Davis szerzői jogait az AI rendszerek képzésében és üzemeltetésében.)

Míg a tartalomszolgáltatók kompenzációt kérnek az információkért, amelyeket a modellek képzésére használtak, a CloudFlare mozgalma új védekező intézkedést jelent a modellek kiképzésére irányuló jövőbeni erőfeszítések ellen.

De nem csupán a rugók blokkolásáról: a CloudFlare azt mondja, hogy piacot akar létrehozni, ahol az AI -társaságok fizethetnek a webhely feltérképezéséért és lekaparásáért, azaz az információk szolgáltatója fizet, és az AI fejlesztő engedélyt kap.

“Ez a tartalom az az üzemanyag, amely az AI motorokat táplálja, és így csak tisztességes, hogy a tartalom alkotóit közvetlenül kompenzálják” – mondta Matthew Prince, a CloudFlare vezérigazgatója egy blogbejegyzésben.

Miért akarják a weboldalak blokkolni az AI robotokat?

A robotok – a botok, amelyek meglátogatják és másolják az információkat egy weboldalról – a csatlakoztatott internet létfontosságú elemei. Így a keresőmotorok, mint például a Google, tudják, mi van a különböző webhelyeken, és hogyan tudják kiszolgálni a legfrissebb információkat olyan helyekről, mint a CNET.

Az AI Crawlers külön kihívásokat jelent a webhelyek számára. Egyrészt agresszívek lehetnek, és fenntarthatatlan forgalmat generálhatnak a kisebb helyek számára. Kevés jutalmat kínálnak a kaparásukért: ha a Google egy webhelyet mászik fel a keresőmotor eredményeire, akkor valószínűleg visszaadja a forgalmat az adott webhelyre, ha beilleszti azt a keresési eredményekbe. Ha az edzési adatokra mászik, nem jelenthet további forgalmat vagy még kevesebbet, ha az emberek abbahagyják a webhely látogatását, és csak az AI modellre támaszkodnak.

Bővebben: AI Essentials: 29 A Gen AI működésének módja az Ön számára, szakértőink szerint

Ez az oka annak, hogy a nagy webhelyek vezetői, például a Pinterest, a Reddit és számos nagy kiadói társaság (köztük a CNET tulajdonosa Ziff Davis) felvidította a Cloudflare híreit a nyilatkozatokban.

“Az alkotók, a platformok, a webhasználók és a rugókerületek teljes ökoszisztémája jobb lesz, ha a mászás átláthatóbb és ellenőrzött, és a CloudFlare erőfeszítései mindenki számára a helyes irányba lépnek” – mondta Steve Huffman, a Reddit vezérigazgatója.

A CloudFlare bejelentéséről kérdezve, az Openai elmondta, hogy a CHATGPT modell célja, hogy elősegítse a felhasználókat az interneten való tartalomhoz, hasonlóan a keresőmotorokhoz, és hogy integrálta a keresést a csevegési funkcióiba. A vállalat azt is kijelentette, hogy külön modellt használ attól, amit a CloudFlare javasolt, hogy lehetővé tegye a kiadók számára, hogy jelezzék, hogyan viselkedjenek az AI robotok, az úgynevezett robots.txt. Az Openai szerint a robotok.txt modell már működik, és a CloudFlare változásai szükségtelenek.

A képzési adatok háború vontatása

Az AI modellek edzéshez rengeteg adatot igényelnek. Így képesek részletes válaszokat adni a kérdésekre, és tisztességes (ha tökéletlen) munkát végezhetnek az információ széles skálájának biztosítása érdekében. Ezeket a modelleket hihetetlen mennyiségű információt táplálják, és kapcsolatokat alakítanak ki a szavak és a fogalmak között, az alapján, amit az edzési adatokban látnak.

A kérdés az, hogy a fejlesztők hogyan kapták meg ezeket az adatokat. Jelenleg tucatnyi pert folynak a tartalom alkotóinak és az AI -társaságok között. Kettő csak a múlt héten látta a fő döntéseket.

Az egyik esetben egy szövetségi bíró úgy döntött, hogy az antropikus követte a törvényt, amikor szerzői jogi védelemmel ellátott könyveket használt a Claude modelljének képzésére-a tisztességes felhasználásnak nevezett koncepción keresztül. Ugyanakkor a bíró azt mondta, hogy a társaság a könyvek állandó könyvtárának létrehozása nem volt, és új tárgyalást rendelt a kalózkodással kapcsolatos állításokról.

Egy külön ügyben a bíró a Meta mellett döntött a társaság és a 13 szerzőből álló csoport közötti vitában. De Vince Chhabria bíró szerint a döntés ebben az esetben nem azt jelenti, hogy a Meta vagy más AI -társaságok elleni jövőbeli ügyek ugyanúgy fognak menni, lényegében, hogy “ezek a felperesek rossz érveket tettek, és nem tudtak nyilvántartást kidolgozni a megfelelő támogatására”.

Az a gondolat, hogy a robotokat egy webhely meglátogatására töltsék fel, nem teljesen új. Más vállalatok, például a Tollbit, olyan szolgáltatásokat kínálnak, amelyek lehetővé teszik a webhelytulajdonosok számára, hogy az AI -társaságokat számolják fel a mászásáért. Will Allen, az AI Control, a magánélet és a médiatermékek vezetője a Tollbitnél azt mondta, hogy a technológia körüli környezet továbbra is fejlődik. “Úgy gondoljuk, hogy nagyon korai a tartalompiac kialakulása, és csak itt kezdünk kísérletezni” – mondta a CNET -nek. “Örülünk, hogy sok különböző modell virágzik.”

A CNET Imad Khan hozzájárult ehhez a jelentéshez.