Az Nvidia DLSS 4-je nem az, aminek gondolod. Döntsük le a mítoszokat

Tartalomjegyzék Tartalomjegyzék Nem, ez nem “jósolja meg a jövőt” A késleltetés nem az a probléma, amelyet Ön szerint ez egy teljesen új modell
Az Nvidia az RTX 5090 bejelentésével ellopta a bemutatót a CES 2025-ön, és a kártya 2000 dolláros árcédulájáról szóló rengeteg vita ellenére sok új technológiát vezet be. Ezek közül a legfõbb a DLSS 4, amely több képkocka generálást hoz az Nvidia GPU-iba, és 4-szeres teljesítménynövekedést kínál több mint 75 játékban azonnal, amikor az Nvidia új RTX 50-es GPU-i megjelennek az utcákon.
Túl sok félreértést tapasztaltam azonban a DLSS 4 tényleges működésével kapcsolatban. Az Nvidia vezérigazgatójának félrevezető megjegyzései és a DLSS működésének radikális újratervezése között nem csoda, hogy téves információk keringenek az új technológiáról, arról, hogy mire képes, és ami kritikus, milyen korlátai vannak.
Tehát tegyük tisztába a rekordot, legalább annyira, amennyire csak lehet, mielőtt az Nvidia új grafikus kártyái megérkeznek, és mindannyian saját bőrükön tapasztaljuk meg, mit kínál a DLSS 4.
Hetente bontsd le a PC-s játékok mögötti technológiát Nem, ez nem „jósolja meg a jövőt” Nvidia
A DLSS 4 működésének megfelelő megértésével kapcsolatos egyik fő probléma az Nvidia vezérigazgatója, Jensen Huang, a Q&A során tett megjegyzéséből fakad. Jarred Walton a Tom’s Hardware-nél megkérdezte Huangot a DLSS 4 működéséről technikai szinten, Huang pedig határozottan tagadta, hogy a DLSS 4 keretinterpolációt használ. Azt mondta, hogy a DLSS 4 „megjósolja a jövőt”, ahelyett, hogy „interpolálná a múltat”. Furcsa idézet, az biztos. Kár, hogy ez helytelen.
Huang a múltban poétikusan foglalkozott a DLSS Frame Generation-vel, és bár ez a fajta keretezés arra szolgál, hogy elmagyarázza a DLSS 4-hez hasonló technológiát a mainstream közönség számára, ez is félreértésekhez vezet a tényleges működésével kapcsolatban. Ezt az idézetet követően több olvasóm is megkeresett, és azt mondta, hogy félreértettem a DLSS 4 működését. Nem értem félre a működését, mint kiderült, de megértem, miért van nagy a zűrzavar.
A DLSS 4 többkockából álló generálása a keretinterpolációnak nevezett technikát használja. Ez ugyanaz a technika, amit a DLSS 3-ban láttunk, és ugyanaz a technika, mint más keretgeneráló eszközökben, például a veszteségmentes skálázásban és az AMD FSR 3-ban. A keretinterpoláció a következőképpen működik: A grafikus kártya két képkockát renderel, majd egy algoritmus lép fel a képkockák közötti különbség kiszámításához. Ezután „generál” egy keretet, amely közé kerül, és kitalálja, hogyan nézne ki a közbeiktatott keret a két megjelenített képkocka közötti különbség alapján.
Nvidia
A DLSS 4 pedig keretinterpolációt használ. Korai kutatások folytak a keretek generálására szolgáló új technikákkal kapcsolatban – különösen az Intel kutatása a keretek extrapolációjával kapcsolatban –, de ez a technológia még korai szakaszban van. Vannak olyan részletek, amelyeket még nem tudok megosztani, de több forrásból is megerősítettem, hogy a DLSS 4 valójában keretinterpolációt használ. Ennek is van értelme. Az ilyen típusú megjelenítő eszközök nem csak a semmiből bukkannak fel, és szinte mindig a kutatási cikkek hosszú sora áll rendelkezésre, mielőtt bármilyen új renderelési technikát piacképes termékké alakítanának, például a DLSS 4-et.
Ez nem von le abból, amire a DLSS 4 képes. Lehet, hogy ugyanazt a technikát használja, mint a DLSS 3 új keretek létrehozásához, de ez nem vonhatja el a figyelmét attól, hogy a DLSS 4 valójában mire képes.
Ön szerint nem a késleltetés a probléma, hanem Jacob Roach / Digital Trends
Megértem, hogy az Nvidia miért nem akar sokat nyilatkozni a DLSS 4 keretinterpolációjának használatáról. Ez azért van, mert a keretinterpoláció késleltetést vezet be. Két képkockát kell renderelni, majd végre kell hajtania az interpolációt a sorozat első képkockája előtt, így ha bármilyen keretinterpolációs eszközt használ, akkor lényegében egy kis késéssel játszik. Az a feltételezés, amit láttam, az az, hogy ezek az extra képkockák lineárisan növelik a késleltetést, ami nem így van.
A Verge aggodalmát fejezte ki, mondván, hogy meg akarja nézni, hogy az új keretgenerációs technológia hogyan befolyásolja a késleltetést, míg a TechSpot kijelentette, hogy „a felhasználók aggódnak amiatt, hogy a több képkocka megjelenítése súlyosbíthatja a (latencia) problémát”. Ez természetes ellentéte a megszaporodó „hamis” képkockáknak, amelyeket a DLSS 4 ki tud kiköpni. Ha egy képkocka generálása késleltetési problémát okoz, akkor ebből három generálás biztosan nagyobb késleltetési problémát okoz. De ez nem így működik.
Ezért olyan fontos megérteni, hogy a DLSS 4 keretinterpolációt használ. A késleltetett lejátszás gondolata semmiben sem különbözik aközött, hogy a DLSS 3 egy plusz keretet generál, és a DLSS 4 generál három extra keretet – a folyamat továbbra is magában foglalja két képkocka renderelését és a köztük lévő különbségek összehasonlítását. A várakozási idő nem növekszik jelentősen egy, két vagy három extra képkocka beszúrása között a két megjelenített kép közé. A közöttük lévő képkockák számától függetlenül a képkocka-interpolációs folyamat által hozzáadott késleltetés nagyrészt azonos.
Hadd illusztráljam ezt. Tegyük fel, hogy 60 képkocka/másodperc (fps) sebességgel játszik egy játékot. Ez azt jelenti, hogy minden egyes képkocka között 16,6 ezredmásodperc van. A DLSS 3 esetén a képkockasebesség megduplázódik, 120 fps, de a késleltetés nem csökken a felére 8,3 ms-ra. A játék simábbnak tűnik, de még mindig van 16,6 ms az egyes renderelt képkockák között. A DLSS 4 segítségével akár 240 képkocka/másodperc sebességet is elérhetsz, megnégyszerezve a képkockasebességet, de a késleltetés még egyszer sem csökken 4,2 ms-ra. Még mindig ugyanaz a 16,6 ms.
Ez egy nagyon lecsökkentő pillantás a PC késleltetésére – a DLSS Frame Generation futtatásához többletköltség jár, plusz a monitor és az egér által hozzáadott késleltetés –, de hasznos annak megértéséhez, hogy a mag késleltetése nem növekszik lineárisan, ha több képkockát adunk a kerethez. interpolációs folyamat. Az egyes megjelenített képkockák közötti idő nem változik. A tapasztalt késleltetés még mindig nagyrészt a DLSS-keretgenerálás előtti alap képkockasebességnek és az eszköz többletterhelésének az eredménye.
DLSS 4 Nvidia RTX 5080 First Look: Super Res + Multi Frame-Gen a Cyberpunk 2077 RT Overdrive-on!
Ehhez nem kell csak a szavamat fogadnod. A Digital Foundry tesztelte a DLSS 4-et, beleértve a késleltetést is, és pontosan azt találta, amit az imént leírtam. “Számomra úgy tűnik, hogy az extra késleltetés nagy része továbbra is az extra képkocka puffereléséből származik, de további köztes képkockák hozzáadása a késleltetés viszonylag minimális növekedésével jár” – írta Richard Leadbetter, a Digital Foundry munkatársa. A kis mértékű további késleltetés egyszerűen abból adódik, hogy a DLSS több képkockát számol ki a két megjelenített között, így a DLSS 4-es késleltetés növekedésének nagy része nem sokban különbözik a DLSS 3-tól.
A DLSS 4 késleltetési problémája nagyrészt ugyanaz, mint a DLSS 3 esetében. Ha alacsony alapképkockasebességgel játszik, szakadás van a tapasztalt reakciókészség és a látható simaság között. Ez a megszakítás jelentősebb lesz a DLSS 4 esetén, de ez nem jelenti azt, hogy ennek következtében hirtelen jelentősen megnövekszik a késleltetés. Ez az oka annak, hogy az Nvidia lenyűgöző új Reflex 2-je nem szükséges a DLSS 4-hez; a DLSS 3-hoz hasonlóan a fejlesztőknek csak a Reflex első verzióját kell megvalósítaniuk, hogy a DLSS 4 működjön.
Egy teljesen új Nvidia modell
A DLSS 4 működésének tisztázása azt hiheti, hogy ez inkább ugyanaz, de ez nem így van. A DLSS 4 nagyon jelentős eltérés a DLSS 3-tól, és ez azért van, mert teljesen más AI-modellt használ. Vagy azt kell mondanom, AI modellek. Az Nvidia részlete szerint a DLSS 4 öt különálló mesterséges intelligencia modellt futtat minden egyes renderelt képkockához Super Resolution, Ray Reconstruction és Multi-Frame Generation használatakor, amelyek mindegyikét ezredmásodpercek alatt kell végrehajtani.
A DLSS 4-ből adódóan az Nvidia megszüntette korábbi Convolution Neural Network (CNN) hálózatát, és most látástranszformátor modellt használ. Két nagy változás van a transzformátor modellel kapcsolatban. Az első az úgynevezett „önfigyelem”. A modell több képkockán keresztül képes nyomon követni a különböző képpontok fontosságát. Az ilyen módon történő önreferencia lehetővé teszi az új modell számára, hogy jobban összpontosítson a problémás területekre, például a szuperfelbontású vékony részletekre, amelyek csillogást mutathatnak.
DLSS sugárrekonstrukció új transzformátormodellel | Alan Wake 2
A transzformátormodellek is jobban skálázhatók, így az Nvidia sokkal több paramétert adhat hozzá a DLSS-hez, mint a korábbi CNN-megközelítés. A cég szerint az új transzformátormodell kétszeres paraméterekkel rendelkezik, sőt.
DLSS szuper felbontás új transzformátor modellel | Horizont Tiltott Nyugat
Amint a fenti videókon is látható, az Nvidia azt állítja, hogy ez az új modell jobb stabilitást és a finom részletek megőrzését biztosítja a korábbi CNN-megközelítéshez képest. Ezek a fejlesztések sem kizárólag az RTX 50-es GPU-kra vonatkoznak. Minden RTX grafikus kártya képes lesz kihasználni az új transzformátor modellt a DLSS 4 játékokban, legalábbis az egyes generációk által támogatott funkciók tekintetében.
Néhányszor láttam a DLSS 4-et működés közben, de a funkció igazi tesztje az Nvidia következő generációs GPU-inak megjelenése lesz. Ezután képes leszek értékelni, hogy a funkció hogyan működik több játékban és forgatókönyvben, hogy lássam, hogyan működik. Ettől függetlenül sok változás történt a funkcióval kapcsolatban, és az Nvidia eddigi megosztásai szerint ezek a változtatások a DLSS-t még jobbá teszik.