Az OpenAI rendelkezik biztonsági frissítést szállított hogy ChatGPT atlasz célja azonnali injekció A mesterséges intelligencia böngészőkben olyan támadások, amelyek rosszindulatú utasításokat rejtenek el a mindennapi tartalomban, amelyet az ügynök elolvashat, miközben működik.
Az Atlas ügynöki módja úgy készült, hogy a böngészőben úgy működjön, ahogyan Ön tenné: oldalakat tekinthet meg, kattinthat és gépelhet, hogy a feladatokat ugyanabban a helyen és kontextusban hajtsa végre. Ez egyben nagyobb értékű célponttá is teszi, mivel az ügynök nem megbízható szövegekkel találkozhat e-mailekben, megosztott dokumentumokban, fórumokban, közösségi bejegyzésekben és bármely megnyitott weboldalon.
A cég alapvető figyelmeztetése egyszerű. A hackerek becsaphatják az ügynök döntéshozatalát azáltal, hogy utasításokat csempésznek be a feladat közben feldolgozott információfolyamba.
Rejtett utasítás, nagy következményekkel
Az OpenAI bejegyzése rávilágít arra, hogy milyen gyorsan fordulhatnak el a dolgok. A támadó rosszindulatú e-mailt küld a beérkező levelek mappájába, amely az ügynöknek írt utasításokat tartalmaz, nem az embernek.
Később, amikor a felhasználó megkéri az Atlaszt, hogy készítsen egy irodán kívüli választ, az ügynök normál munka közben belefut az e-mailbe, és a beadott utasításokat mérvadónak tekinti. A demó forgatókönyvben az ügynök felmondólevelet küld a felhasználó vezérigazgatójának, és soha nem írják meg a kiszállást.
Ha egy ügynök egy legitim munkafolyamat részeként ellenőrzi a harmadik féltől származó tartalmat, a támadó megpróbálhatja felülbírálni a felhasználó kérését úgy, hogy a parancsokat elrejti egy közönséges szövegbe.
Egy AI-támadó gyakorló futásokat kap
A hibák korábbi felderítése érdekében az OpenAI azt állítja, hogy felépített egy automatizált támadómodellt, és megerősített tanulással betanította azt a böngészőügynökök elleni azonnali befecskendezési támadásokra. A cél a hosszú, valósághű munkafolyamatok nyomáspróbája, nem csak egyetlen rossz kimenet kényszerítése.
A támadó elkészítheti a jelölt injekciót, lefuttathatja a célügynök viselkedésének szimulált közzétételét, majd ismétlést végezhet visszajelzésként a visszaadott érvelés és cselekvési nyomkövetés használatával. Az OpenAI szerint az ezekhez a nyomokhoz való kiváltságos hozzáférés olyan előnyt jelent a belső vörös csapatának, amellyel a külső támadók nem rendelkeznek.
Ezzel most mit lehet kezdeni
Az OpenAI-keretek hosszú távú biztonsági problémaként kérik az injekciót, inkább online csaláshoz, semmint egyszer kijavított hibához. Megközelítése az új támadási minták felfedezése, az ellenük való edzés, valamint a rendszerszintű biztosítékok szigorítása.
A felhasználók számára érdemes használni kijelentkezett böngészés amikor csak teheti, ellenőrizze az olyan műveletek megerősítését, mint például az e-mailek küldése, és adjon szűk, egyértelmű utasításokat az ügynököknek a széles körű „mindent kezel” utasítások helyett. Ha még mindig kíváncsi vagy mire AI böngészés megteheti, majd használjon olyan böngészőket, amelyek az Ön számára előnyös frissítéseket szállítanak.









