Home Tudomány és technika A Reddit bepereli a Perplexityt és három másik céget, mert állítólag fizetés...

A Reddit bepereli a Perplexityt és három másik céget, mert állítólag fizetés nélkül használták fel a tartalmát

2
0

A Reddit bepereli a SerApi, az OxyLabs, az AWMProxy és a Perplexity cégeket, mert állítólag kikaparták adataikat a keresési eredményekből, és engedély nélkül használták azokat. – írja a New York Times. Az új per következik jogi lépéseket az Anthropic AI startup ellen, amely állítólag Reddit tartalmat használt a Claude chatbot képzésére.

2023-tól Reddit díjat számít fel a cégeknek bejegyzésekhez és más tartalmakhoz való hozzáférést keresve abban a reményben, hogy pénzt kereshet az AI-oktatáshoz felhasználható adatokkal. A cég licencszerződéseket is kötött olyan cégekkel, mint Google és OpenAIés még épített egy Saját AI üzenetrögzítő hasznosítani a tudást a felhasználók hozzászólásaiban. A Reddit-tartalom keresési eredményeinek lekaparása elkerüli ezeket a kifizetéseket, ezért a vállalat pénzügyi kártérítést és tartós végzést kér, amely megakadályozza, hogy a vállalatok eladják a korábban lekapart Reddit-anyagokat.

Néhány vállalat, amelyre a Reddit összpontosít, mint például a SerApi, az OxyLabs és az AWMProxy, nem éppen háztartásbeli nevek, de mindegyikük üzleti tevékenységük kulcsfontosságú részévé tette a keresési eredményekből származó adatok gyűjtését és értékesítését. Talán nyilvánvalóbb, hogy a perplexitás szerepel a perben. Az AI-cégnek adatokra van szüksége modelljei betanításához, és már meg is tette elkapták látszólag olyan anyagok másolása és visszatorlódása, amelyeket nem fizetett ki az engedélyért. Ez is magában foglalja állítólag figyelmen kívül hagyja a robots.txt protokolltegy módja annak, hogy a webhelyek közöljék, hogy nem akarják, hogy az anyagukat lekaparják.

másolata szerint a pert Az Engadget számára a Reddit már küldött egy felmondást a Perplexity-nek, és kérte, hogy hagyja abba a bejegyzések engedély nélküli kaparását. A cég azt állította, hogy nem használta a Reddit adatait, de továbbra is hivatkozott a platformra a chatbotja válaszaiban. A Reddit azt állítja, hogy sikerült bebizonyítania, hogy a Perplexity lekapart Reddit-tartalmat használt egy „tesztbejegyzés” létrehozásával, amelyet „csak a Google keresőmotorja tudott feltérképezni, és egyébként nem volt elérhető sehol az interneten”. Néhány órán belül a Perplexity válaszmotorjához intézett lekérdezések képesek voltak reprodukálni a bejegyzés tartalmát.

„Az egyetlen módja annak, hogy a Perplexity megszerezze azt a Reddit-tartalmat, majd felhasználhassa azt a válaszmotorjában, ha ő és/vagy alperesei a Google-t (keresési eredményeket) összekaparta a Reddit-tartalommal, majd a Perplexity gyorsan beépítette ezeket az adatokat a válaszmotorjába” – áll a keresetben.

Amikor megjegyzést kértek, a Perplexity a következő kijelentést tette:

A Perplexity még nem kapta meg a keresetet, de mindig erélyesen fogunk küzdeni a felhasználók jogaiért, hogy szabadon és tisztességesen hozzáférjenek a közismeretekhez. Megközelítésünk továbbra is elvi és felelősségteljes, mivel pontos mesterséges intelligencia segítségével tényszerű válaszokat adunk, és nem tűrjük el a nyitottság és a közérdek elleni fenyegetést.

Ez az új kereset illeszkedik a Reddit agresszív álláspontjához, amelyet adatai védelme érdekében képviselt, beleértve sebességkorlátozó ismeretlen robotok és webrobotok 2024-ben, és sőt korlátozza milyen hozzáféréssel rendelkezik az Internet Archívum Wayback Machine webhelye 2025 augusztusában. A vállalat a webhelyek feltérképezésére vonatkozó új kifejezések meghatározására is törekedett azáltal, hogy elfogadta a Tényleg egyszerű licencelési szabványamely licencfeltételeket ad a robots.txt fájlhoz.

Fuente de noticias