Home Hír DeepSeek a fejére fordította az AI világot, de még nem esik a...

DeepSeek a fejére fordította az AI világot, de még nem esik a hype -re

116
0

Az AI -nek csak a Sputnik pillanata volt.

Marc Andreessen vállalkozó, a múlt vasárnap, a korábban Twitter néven ismert közösségi média platformon, az X -nél, az X -en. A Szilícium-völgy, a tőzsde és az online prognosztizátorok mellett, mind a szeizmikus szintű tevékenységnek tűnik az AI térben.

A DeepSeek AI, a kínai új AI modell, amely az Apple App Store tetejére ugrott, visszhangokat küld a Szilícium -völgyben. A DeepSeek azt állítja, hogy az AI versenyez, és bizonyos esetekben felülmúlja az Openai O1 érvelési modelljét a költségek töredékén. Nem csak, hogy a DeepSeek R1 modellje teljesen nyílt forrású, azaz a kód nyíltan elérhető, és bárki ingyenesen használhatja.

A DeepSeek-R1 és az Openai O1 közötti kulcsfontosságú megkülönböztető az, hogy az R1 lehetővé teszi annak gondolatláncának látását. Hihetetlen betekintést nyújt az AI „gondolkodik”. Valójában láthatja, hogy megpróbálja megválaszolni a Tiananmen Square -rel kapcsolatos kérdéseket, mielőtt a Midway -i válaszát lemondja. Az NVIDIA, az AI forradalmat tápláló chips -t, amely szerint részvényei 18% -kal zuhannak, és a DeepSeek hétvégi emelkedése után rekord 600 milliárd dollárt veszítettek el. Van értelme. Ha a DeepSeek mondása igaz, akkor az O1-szintű teljesítmény közelében érhető el a látszólag idősebb Nvidia chipeknél, miközben a költségek kis százalékát költi.

Az online kommentátorok még mindig megpróbálják értelmezni a mélység hirtelen megjelenését az AI piacon. Valójában alacsonyabb költséggel jár az O1 -vel? Mennyire igaz lehet a DeepSeek és Kína állításai a hatékonyságra? A költségmegtakarítások egy jelentős műszaki feloldásból származnak -e, vagy a kínai ellátási lánc más területei miatt olcsóbb használni?

Függetlenül attól, az R1 lenyűgöző.

„Ez a megfizethetőség megnyitja az ajtót a kisebb vállalatok és az induló vállalkozások számára, hogy a CNET -hez intézett nyilatkozatában Mel Morris, a Corpora AI, az AI kutatómotor vezérigazgatója, a Corpora AI vezérigazgatója, a Corpora AI vezérigazgatója. Morris hozzátette, hogy a DeepSeek versenyt jelentenek a megalapozott AI -játékosok számára, és „jelenléte valószínűleg gyorsabban elősegíti az AI technológiát, ami hatékonyabb és hozzáférhetőbb megoldásokhoz vezet a növekvő igény kielégítésére”.

Lehetséges, hogy az OpenAI vezérigazgatója szombaton csökkentette az árait a top-end O3 mini lekérdezéseiért.

Mivel a Big Tech folyamatosan milliárd dollárt dob, az energiát és az energiát az AI -nál, a DeepSeek hatékonyságának feloldása hasonlíthat a látott ugráshoz, amikor az autók a porlasztókról az üzemanyag -befecskendező rendszerekre mentek. Az Openai -val ellentétben a DeepSeek R1 modellje nyílt forráskódú, vagyis bárki használhatja a technológiát. Ez a piac komoly zavara, amelyet jelenleg az Openai Chatgpt és a Google Ikrek uralnak, amelyek mindkettő bezárt, és megköveteli a felhasználóktól, hogy fizessenek teljes hozzáférést a funkciókészletükhöz.

Az Egyesült Államok és Kína közötti AI -versenyen Amerika előtt állt a Szilícium -völgy hatalmas befektetési dumpjának és a kormány blokádjának az NVIDIA -ban, amely a legutóbbi AI chipeket árusította Kínának. Ennek a blokádnak azonban csak arra ösztönözte Kínát, hogy gyorsabban készítse el saját chipeit. A pénzt, valamint a protekcionizmust úgy tekintették, hogy Kínát a második helyen tartsák, így a világ az amerikai technológiára támaszkodik. Lehet, hogy ez a dinamika eltolódott. Most a fogyasztók és a vállalatok világszerte hozzáférhetnek egy nagyon teljesítményű „érvelési” modellhez a költségek töredékén. Nem csak, hogy a Tiktok anyavállalat Bytedane még olcsóbb modellt adott ki az R1 -nek.

Ahogy a piacok és a közösségi média reagálnak a Kínából származó új fejleményekre, lehet, hogy túl korai lenne azt mondani, hogy Amerikát megverték. De legalább Kína gyorsan felzárkózik.
„Kína már elkészítette a GPT-4 minőségi modelleket, de volt egy hosszabb időkben-mint egy év, másfél év, valami hasonló. De most van egy kínai modell, amely talán csak hat éves Hónapok mögött, és azt hiszem, ez különbség „-mondta Lucas Hansen, a Civai társalapítója, egy nonprofit szervezet, amely szoftvert használ annak bemutatására, hogy mire képes. „Tehát az Egyesült Államoknak még mindig van vezetése, de nem olyan nagy, mint korábban.”

Az egyik dolog, amely minden bizonnyal segít az AI vállalatoknak az OpenAI felzárkóztatásában, az R1 képessége, hogy a felhasználók elolvassák a gondolatláncát. Még akkor is, ha az R1 nem kap minden választ megfelelőt, akkor láthatja, hogy az okok miként segíthetnek jobban fejleszteni. Hansen szerint a „sokk és félelem” emberek az R1 -rel érzik magukat a gondolatlánc elolvasásának képességéből. Ez az a betekintés, hogy az Openai nem adott hozzáférést az O1 modelljével, mivel a titkos szósz elrejtése miatt az emberek havi előfizetési költségeket tesznek ki a hozzáféréshez.

Ennek ellenére van egy olyan szintű szkepticizmus, amelyet az R1 költség-teljesítési arányával kell venni. A DeepSeek által közzétett fehér könyvnek több mint 100 társszerzője volt. Ez nagyon sok agyi erő az AI kiképzéséhez az alacsony, 5,5 millió dollár költséggel. Ez az 5,5 millió dolláros költség csak a modell kiképzésének energiaköltségei lehetnek, levonva minden kutató egyéni fizetését, ám Kína nem volt teljesen átlátható abban, hogy kiszámította ezeket az energiaköltségeket. Az adatközpont felállításának költsége Kínában valószínűleg különbözik az Egyesült Államokban történő felállításától. És nem biztos, hogy Hansen szerint a felhőszolgáltató vagy maga a kínai kormány támogatja -e a költségeket.

Szkepticizmus is van a DeepSeek chips -jén is, amelyet a modell képzésére használtak. Az a cég, amely valójában a régebbi NVIDIA A100 és H800 chipeket használja, vagy Kína más eszközökkel fér hozzá a legújabb H100 chipekhez, amint azt Alexandr Wang, a Scale AI vezérigazgatója mondta.

Még akkor is, ha ezt az 5,5 millió dolláros értéket nagyon konzervatív becslésként vesszük, ez még mindig lényegesen kevesebb, mint a 100 millió dolláros Openai költsége a GPT-4 kiképzéséhez, a vállalatok korábbi AI modelljéhez. Az Openai nem bocsátotta ki az O1 felépítésének költségeit, de mivel az ügyfelek számára sokkal magasabb tokenköltség volt, valószínűleg drágább volt.

„Az adatközpont terhelésével az Egyesült Államokban 2030 -ig várhatóan megduplázódik vagy hármas, minden hatékonysági megtakarítás jelentős hatással lehet” – mondta Mark James, a Vermont Law és a Környezetvédelmi Intézet ideiglenes igazgatója, valamint a végzős iskola nyilatkozatában. – A közműveket már hangsúlyozzák az AI nagy energiaigénye. Ha a DeepSeek állításai helyesek, akkor ez nagymértékben megkönnyítheti a potenciális villamosenergia -terhelést, enyhítve mind a fogyasztók, mind a környezet stresszét. „A legfontosabb oldalról” – mondta James -, a hatékonyabb modellek még nagyobb növekedést tudnak kinyitni az ágazatban, ami enyhítené a hatékonyság megtakarítását és súlyosbíthatja a rácsunk stresszét. „

Azt állítja, hogy az Egyesült Államok elvesztette az AI háborút. Legalábbis a táj azonnal versenyképesebbé vált, és van hely a folyamatos innovációra. A DeepSeek nem azt is jelenti, hogy a világ a mesterséges általános intelligencia, vagy a Super Advanced AI elérése, amely okosabb, mint az emberek, és képes önmagát tanítani.

„Nem hiszem, hogy a DeepSeek egy milliméterrel közelebb hozza a mesterséges általános intelligenciát (AGI), de azt hiszem, hogy közelebb hozza a kereskedelemben életképes nagy nyelvi modell (LLM) alkalmazásokhoz, ami fantasztikus” – mondta A SuperIntelligence (ASI) Szövetség és a SingularityNet alapítója. A DeepSeek továbbra is ugyanazok a kognitív korlátozások, mint a többi AI modell. Ennek ellenére DeepSeek hatékonysága tovább demokratizálhatja az AI -t.