A vállalat neve ellenére az OpenAi 2019-ben a GPT-2 óta nem dobta el az AI-modellek nyitott verzióját. Ez kedden megváltozott, mivel Sam Altman vezérigazgató két új nyílt súlyú, a GPT-OSS-120B (120 milliárd paraméter) és a GPT-20B (20 milliárd paraméter) elnevezésű AI-modelleket.
Ha a nyílt súlyok egy új darab AI zsargon, ne aggódj. A lehető legegyszerűbb szempontból a nyílt súlyok olyan AI modellek kategóriája, amelyek olyan termékeket hajtanak végre, mint a chatbotok, a kép és a videogenerátorok. De filozófiai szempontból különböznek a technológiától, amely alátámasztja az AI eszközöket, amelyeket most használhat. A Chatgpt, az Ikrek és a Copilot mind zárt modellekkel működik, ami azt jelenti, hogy nincs valódi betekintésünk a fekete dobozos gépek működésébe. A nyílt súlyú modellek úgy néznek ki, hogy a függöny mögött a mechanikus varázslóba nézzenek.
A GPT-OSS nagy ügy; Ez egy korszerű nyílt súlyú érvelési modell, amelynek erős valós teljesítménye összehasonlítható az O4-Mini-vel, amelyet a saját számítógépén (vagy a kisebb méretű telefonon) helyben futtathat. Hisszük, hogy ez a legjobb és leghasználhatóbb nyitott modell a…
– Sam Altman (@Sama) 2025. augusztus 5.
Nem kell fejlesztőnek vagy gépi tanulási szakértőnek lennie ahhoz, hogy megértse, hogyan működnek ezek a nyitott modellek, vagy akár maguk is működtetik őket. Itt van minden, amit tudnia kell a nyílt súlyokról és a nyílt forráskódú AI modellekről.
Mi az a nyílt súlyú AI modell?
Az összes AI modellnek van súlya, amelyek jellemzők vagy elemek. A modelleket arra képzik, hogy bizonyos kapcsolatok nagyobb súlyt vagy értéket biztosítsanak.
A nyílt súlyú modell pontosan azt teszi, amit a neve jelent-a súlyok nyilvánosan rendelkezésre állnak, a Szövetségi Kereskedelmi Bizottság által meghatározottak szerint. A fejlesztők láthatják ezeket a súlyokat, és hogyan használják őket az AI modellek létrehozásában.
“Vitathatatlanul, a nagy (nyelvi) modellekben a legértékesebb dolog a súlyok. Sokat tehet, ha van súlya, ami kissé különbözik a hagyományos szoftverektől” – mondta Omar Khattab, a MIT számítógépes tudományának asszisztens professzora és a CNET -ben a MIT -tudomány és a mesterséges hírszerző laboratórium kutatója és kutatója.
Például egy chatbot épül fel, hogy nagyon jó legyen a következő logikai szó előrejelzésében egy mondatban. Képzett, hogy összehúzza azokat a szavakat, amelyek a kimeneteiben gyakran megjelennek egymás mellett az edzési adataiban, feltehetően logikus sorrendben. Azok a szavak, amelyek gyakrabban jelennek meg egymás mellett, nagyobb súlyt kaphatnak, mint a szavak, amelyek gyakran nem jelennek meg egymás mellett.
Ezek a súlyok csak számok, de a nyitott súlyú modellek is tartalmaznak egy térképet.
“Nyílt súlyokban (modellekben) megkapja a súlyokat, amelyek ezek a számok, és megkapja, hogyan lehet ezeket a súlyokat a neurális hálózat struktúrájába leképezni, így a neurális hálózat rétegei, hogy valóban képesek legyenek futtatni”-mondta Khattab. A modell architektúrája megmutatja, hogy egy vállalat hogyan építheti fel a modelleket, ami “hihetetlenül értékes”.
A nyílt súlyú modellek elsősorban a fejlesztőkre irányulnak, akik a modellt integrálhatják a meglévő projektekbe, például az AI ügynökök felépítésében. A “elkötelezett hobbi” számára, amint a Khattab állította, a specifikációk segítségével a modellt helyben futtathatja a laptopján, ami segíthet enyhíteni az esetleges adatvédelmi aggályokat, például az AI használatával egy vállalat mobilalkalmazásán keresztül. A kutatók egyértelműbb áttekintést kapnak az AI belső működéséről.
Elena Uve/istock/Getty Images Plushow Do Do Openai új nyitott súlyú modelljeit rakják össze?
Az új nyílt súlyú modellek két méretben, 120 milliárd paraméterben (128 szakértő és 128K kontextus ablak) és 20 milliárd paraméter (32 szakértő, de ugyanaz a 128K kontextus ablak) kaphatók. A szakértők utalnak a modell által a szub-neurális hálózatok számára, és a kontextusú ablakok leírják, hogy a modell mennyi információt tud feldolgozni, és beépítheti a válaszaiba. Mindkettő nagyobb száma azt jelzi, hogy a modell képes kifinomultabb válaszokra, és több tűzerővel rendelkezik.
A teljesítmény szempontjából az OpenAi arról számol be, hogy a 120B-os modell „közel paritás” legújabb érvelési modelljével, az O4-MINI-vel az alapvető érvelési referenciaértékekkel, miközben egyetlen 80 gigabájt GPU-n fut. A 20B-os nyitott súlyú modell, mint az O3-MINI-hez hasonlóan, és 16 gigabájt eszközön futott-vagyis, ez a kisebb nyílt súlyú modell meglehetősen jól futtatható a laptopokon és néhány okostelefonon. (Mint minden AI modell helyben fut, a sebessége a készülék tűzerőjétől függ.)
A modellek az Apache 2.0 licenc alatt állnak rendelkezésre, amely egyfajta nyílt forráskódú-barát licenc. Megnézheti a modellkártya és a biztonsági képzésről szóló papír részletesebb specifikációit, tippeket kaphat az OpenAi fejlesztői irányelveiről, és megnézheti a HuGingface és a Github súlyát.
A CNET IMAD Khan telepítette a GPT-OSS-20B-t egy kifejezetten a helyi AI modellek futtatására épített számítógépre.
Imad Khan/CNETIS nyitott súlyú képernyőképe ugyanúgy, mint a nyílt forráskódú AI?
A nyílt súlyú modellek a nyílt forráskódú AI-hez kapcsolódnak, de nem pontosan ugyanazok. A nyílt forráskódú, mint egy koncepció olyan szoftverre utal, amelynek nincs védett tulajdonosa, akinek a forráskódja nyilvánosan elérhető, és a legtöbb bárki használhatja nyílt forrású engedélyek alapján. A nyílt forráskódú szoftverek támogató nonprofit szervezete, a nyílt forráskódú kezdeményezés, a nyílt forráskódú AI-t úgy határozza meg, hogy “olyan rendszerek szerint rendelkezésre áll, amelyek a felhasználók számára biztosítják a felhasználók számára a használat, tanulmányozás, módosítás és megosztás (IT) használatát”.
A nyílt súlyú AI modell nem ugyanaz, mint a nyílt forráskódú modell. A kettő közötti különbség gondolkodásának egyik módja, mint a sütés, Suba Vasudevan, a Mozilla.org vezérigazgatója és a Mozilla Corporation vezető alelnöke mondta a CNET -nek.
“A nyílt súlyú modell az, hogy valaki megadja neked ezt a sült tortát, és azt mondja:” Ó, lisztből, cukorból és tojásból készül. ” Ezek a súlyok.
A nyílt súlyú modellek esetében a nem nyilvánosságra hozatal típusai azok az adatok, amelyekben a modell képzett és a képzéshez használt kód. Az adatok képzési pontja az AI vállalatok és az emberek közötti vitapont, amely tartalmat teremt; Az AI-társaságok a magas színvonalú, az ember által létrehozott tartalmat a modellek finomítása és fejlesztése érdekében. Egyes vállalatok licencszerződésekkel gyűjtik ezeket az adatokat, de egyes kiadói és alkotók pert indítottak, azzal állítva, hogy az AI -társaságok illegálisan megszerezik szerzői jogi védelem alatt álló tartalmukat. (Nyilvánosság: Ziff Davis, a CNET anyavállalata áprilisban pert indított az Openai ellen, állítva, hogy megsértette a ZIFF Davis szerzői jogait az AI rendszerek képzésében és üzemeltetésében.)
A képzési adatok, eredetétől függetlenül, az egyik legértékesebb dolog, amelyet egy AI -társaság él. De valószínűleg nem szerepel a nyílt súlyú modell kiadásában.
“Úgy gondolom, hogy a puszta skála miatt (az adatok), a felelősség miatt, mivel ennek nagy része engedéllyel rendelkezik, és nem szabad megosztania azt, azt hiszem, valószínűleg tisztességes feltételezni, hogy legalább egyetlen olyan társaság sem, amelyet nonprofit szervezet sem fog kiadni, ezt hamarosan, talán valaha is felszabadítja”-mondta Khattab.
Az igazán nyílt forráskódú AI nyilvánosan elérhető információkkal érkezik-mondta Vasudevan. A nyílt súlyú modelleket nehezebb lehet átképzni vagy ellenőrizni az elfogultságot a kiegészítő információk nélkül. “Még mindig egyértelműen vagy a sötétben arról, hogy miként építették, vagy milyen adatok alakították ki” – mondta Vasudevan.
Nézze meg ezt: Hogyan beszélsz a chatgpt ügyekkel. Így van
04:12 Miért érdekelnék a nyílt forráskódú AI-t?
Ezek a különbségek a nyílt forráskódú, a nyílt súlyok és a zárt modellek között valószínűleg nem befolyásolják az Ön átlagos tapasztalatait egy AI chatbot segítségével. De fontos tulajdonságok a fejlesztők számára, hogy fontolják meg bizonyos AI modellek kiválasztása és használatakor, és ezek szélesebb körben fontosak számunkra, hogy megértsük az online életünkbe beszivárgó technológiát.
Nincs garancia arra, hogy a nyitott súlyú modellek belső működése tükrözi azt, ami a zárt modelljein belül van-mondta Khattab. De egy olyan társaság számára, amelynek terméke az AI generációja szinonimája, minden fény, hogy működjön, minden bizonnyal hatással lesz az emberekre, akik azt használják, és azokra, akik a színfalak mögött tervezik. Amint az emberek elkezdenek bejutni a gyomokba az új modellekkel, többet megtudunk, és megnézhetjük, milyen hatással van az iparágra.
Összességében a nyílt forráskódú filozófiája az, hogy a technológia javul, ha több ember fér hozzá, mint például a tudósok, akik képesek tanulmányozni, és a biztonsági szakértők, akik felfedhetik a gyengeségeket. “Hagyja, hogy az emberek építhessenek, méretezjenek és innováljanak, és képesek legyenek lyukakat kiaknázni és jobbá tenni” – mondta Vasudevan.
További információkért nézze meg a Chatgpt kezdő útmutatóját és azt, hogy az AI hogyan változtatja meg a keresési élményt.