Home Tudomány és technika A Google DeepMind Genie 3 dinamikusan megváltoztathatja szimulált világának állapotát

A Google DeepMind Genie 3 dinamikusan megváltoztathatja szimulált világának állapotát

7
0

December elején a Google DeepMind kiadta a Genie 2 -et. Az AI rendszerek Genie családja az úgynevezett világmodellek. Képesek képeket generálni felhasználóként – akár emberként, akár, valószínűbb, hogy egy automatizált AI -ügynök – a szoftver szimulációját a világon mozgatja. A felhatalmazásban szereplő modellből származó videó videojátéknak tűnhet, de a DeepMind mindig a Genie 2 -et helyezte el úgy, hogy más AI rendszerek kiképzéséhez jobb legyen, hogy jobban megtervezzék. Az új Genie 3 modelljével, amelyet a laboratórium kedden bejelentett, a DeepMind úgy véli, hogy még jobb rendszert készített az AI ügynökök képzésére.

Első pillantásra a Genie 2 és a 3. közötti ugrás nem olyan drámai, mint a modellt a tavalyi évben. A Genie 2 -vel a DeepMind rendszere képessé vált a 3D -s világok előállítására, és pontosan rekonstruálhatja a környezet egy részét, még akkor is, ha a felhasználó vagy egy AI ügynök elhagyta a generált jelenet más részeit. A környezeti konzisztencia gyakran a korábbi világmodellek gyengesége volt. Például a DECART OASIS -rendszerének nehezen emlékezett meg az általa generált Minecraft szintek elrendezésére.

Összehasonlításképpen: a Genie 3 által kínált fejlesztések szerényebbnek tűnnek, ám a mai hivatalos bejelentés előtt tartott Google sajtóközleményében Shlomi Fruchter, a Deepmind kutatási igazgatója és Jack Parker-Holder, a Deepmind kutatója azt állította, hogy fontos lépcsőzetes köveket képviselnek a mesterséges általános intelligencia felé vezető úton.

Google DeepMind

Tehát pontosan mit tesz a Genie 3 jobban? A kezdéshez a felvételeket 720p -on adja ki, a 360p helyett, mint az elődje. Ez is képes hosszabb ideig fenntartani egy “következetes” szimulációt. A Genie 2 elméleti határértéke akár 60 másodperc is volt, de a gyakorlatban a modell gyakran sokkal korábban elkezdi hallucinálni. Ezzel szemben a DeepMind szerint a Genie 3 néhány percig képes futni, mielőtt elkezdi a tárgyak előállítását.

A modell újdonságai egy olyan képesség, amely a DeepMind “lenyűgöző világ eseményeinek” hívja. A Genie 2 interaktív volt, mivel a felhasználó vagy az AI ügynök képes volt beírni a mozgási parancsokat, és a modell reagálna, miután néhány pillanat volt a következő keret előállításához. A Genie 3 valós időben elvégzi ezt a munkát. Sőt, a szimulációt olyan szöveges utasításokkal módosítani lehet, amelyek arra utasítják a Genie -t, hogy változtassa meg a generált világ állapotát. Egy Demo DeepMind kimutatta, hogy a modell azt mondta, hogy helyezze be a szarvascsorkat a hegyre síelõ személy jelenetébe. A szarvas nem mozogott a legrealisztikusabb módon, de ez a Genie 3 gyilkos tulajdonsága – mondja Deepmind.

Google DeepMind

Mint korábban említettük, a laboratórium elsősorban az AI -ügynökök képzésének és értékelésének eszközeként tervezi a modellt. A DeepMind szerint a Genie 3 felhasználható az AI rendszerek megtanítására a “mi lenne, ha” forgatókönyvek kezelésére, amelyeket az előzetes edzés nem fedez. “Nagyon sok olyan dolognak kell történnie, mielőtt egy modellt alkalmazni lehet a való világban, de úgy látjuk, hogy ez a modellek hatékonyabb képzési és megbízhatóságának növelésére szolgál”-mondta Fruchter, rámutatva például egy olyan forgatókönyvre, amelyben egy önálló autó tanítására használhatók, hogyan kell biztonságosan elkerülni egy gyalogos, amely elõtt jár.

Annak ellenére, hogy a DeepMind a Genie -hez tett fejlesztéseket, a laboratórium elismeri, hogy még sok tennivaló van. Például a modell nem tud tökéletes pontossággal generálni a valós helyeket, és küzd a szöveg megjelenítésével. Sőt, hogy a Genie valóban hasznos legyen, a DeepMind úgy véli, hogy a modellnek órákig, nem pedig percekig képesnek kell lennie a szimulált világ fenntartására. Ennek ellenére a laboratórium úgy érzi, hogy Genie készen áll a valós hatással.

“Mi már azon a ponton, ahol nem használnánk (Genie), mint egyetlen képzési környezet, de minden bizonnyal megtalálhat olyan dolgokat, amelyeket nem szeretné, ha az ügynökök megtennék, mert ha bizonyos beállításokban nem biztonságosak, akkor is, ha ezek a beállítások nem tökéletesek, akkor még mindig jó tudni”-mondta Parker-Holder. “Már láthatja, hogy hova megy ez. Egyre hasznosabb lesz, mivel a modellek javulnak.”

Egyelőre a Genie 3 nem érhető el a nagyközönség számára. DeepMind szerint azonban arra törekszik, hogy a modell hozzáférhető legyen a további tesztelők számára.