Home Hír A Meta legújabb nyílt forráskódú AI modelljei kihívást jelentenek a GPT, az...

A Meta legújabb nyílt forráskódú AI modelljei kihívást jelentenek a GPT, az Ikrek és a Claude

27
0

A Meta bejelentette a nyílt forráskódú AI Model Family Llama 4 legújabb iterációját, amelyet a márka fejlesztett ki, míg a generatív AI-iparban a verseny továbbra is fokozódik.

Az új AI család négy modellt tartalmaz, és a Meta részletes Llama 4 Scout, a Llama 4 Maverick és a Llama 4 Behemoth. A Meta az AI weboldalán részletezte, hogy a modelleket „nagy mennyiségű, nem jelölt szöveg, kép és videoadat” képzték. Ez azt jelzi, hogy a modellek változatos multimodális képességekkel rendelkeznek.

Meta

Jelenleg két modell- a Llama 4 Scout és a Llama 4 Maverick- elérhető a felhasználók számára a Meta platformjai között, beleértve a WhatsApp, a Messenger és az Instagram Direct-t, a Meta AI weboldalán, a Llama.com-n kívül, szombaton. A fejlesztők az AI modelleket is elérhetik a nyílt forráskódú tárolóknál, például az arc átöleléséhez. A Llama 4 Behemoth modellje még nem jelent meg, és még mindig képzésben van. A vállalat jelezte, hogy az iparágnak elvárnia kell, hogy a Behemoth modell felülmúlja az összehasonlítható modelleket, és hogy ez a Llama 4 család többi modelljének tanárként szolgál.

Belső tesztelése mellett a Meta összehasonlította a Llama 4 modelleket az AI technológiák versenytársával, hogy meghatározzák kapacitásukat és a legjobb felhasználási eseteket. A társaság jelezte, hogy a Llama 4 Maverick a legjobban működik a kreatív íráshoz. Ezenkívül felülmúlta az Openai GPT-4O és a Google Gemini 2.0 modelleket olyan funkciókban, mint a kódolás, az érvelés, a többnyelvű, a hosszú kontextus és a képgenerálás. Eközben Maverick küzdött az AI modellek, köztük a Gemini 2.5 Pro, a GPT-4.5 és az Antropic Claude 3.7 szonett képességeivel.

Míg a Meta azt állítja, hogy a Behemoth felülmúlhatja ezen modellek többségét, kivéve a Gemini 2.5 Pro -t, a vállalat nem tudta csökkenteni a legerősebb modell képzésének hardverköltségeit.

A TechCrunch megjegyezte, hogy a kínai AI -társaság, a DeepSeek figyelmét a versenyképes, mégis olcsó modellekből szerezte a Meta figyelmeztetésre. A vállalat állítólag intenzíven tanulmányozta, hogy a rivális cég hogyan fejlesztette ki figyelemre méltó modelljeit, beleértve az R1 -et és a V3 -at, alacsonyabb működési költségekkel, mint a korábbi láma modellek.

A társaság részletezte, hogy a Llama 4 Scout modell egy NVIDIA H100 GPU -n futhat. A LLAMA 4 Maverick modell egy NVIDIA H100 DGX grafikus rendszeren futhat.

A Meta az első Llamacon AI konferenciáját április 29 -én tartja. A társaságnak van egy önálló Meta AI chatbotja is, amelyet az év második negyedévében indítanak, a CNBC szerint.

A Meta nem az egyetlen vállalat, amely a gyömbérrel rendelkezik a fő AI modellek ütemtervével. Az Openai nemrégiben beállította a GPT-5 modell bevezetését, a cég vezérigazgatójával, Sam Altman-nal, aki a közösségi médiában bejelentette, hogy a rajongóknak az elkövetkező hetekben új O3 és O4-Mini érvelési modelleket kell várniuk a GPT-5 alternatívájaként. Az ügyvezető igazgató részletezte, hogy a GPT-5 az elkövetkező hónapokban indul, amely további időt ad az OpenAi számára, hogy a modellt a Standard-ra hozza.