Májusban az Antropikus két új AI rendszert jelentett be, Opus 4 és Sonnet 4– Most, kevesebb, mint hat hónappal később, a vállalat bemutatja a Sonnet 4.5 -et, és a világ legjobb kódolási modelljének nevezi. Az antropikus ehhez az állításhoz az a referenciaértékek válogatása, ahol az új AI nemcsak elődje, hanem a drágább Opus 4.1 és a versengő rendszerek, beleértve a Google -t is felülmúlja, a Google -t is felülmúlja Ikrek 2.5 Pro és GPT-5 az Openai-tól– Például az Osworld-ban, egy olyan lakosztályban, amely az AI modelleket teszteli a valós számítógépes feladatokon, a Sonnet 4.5 rekord pontszámot 61,4 százalékos pontszámmal állított fel, 17 százalékponttal az Opus 4.1 fölé helyezve.
Ugyanakkor az új modell képes autonóm módon többlépcsős projektekkel foglalkozni több mint 30 órán keresztül, ami a hét órás Opus 4-hez képest jelentősen javulhat a bevezetéskor. Ez egy fontos mérföldkő az agentikus rendszerek típusa számára, amelyet az antropikus felépíteni akar.
A Sonnet 4.5 felülmúlja az antropikus régebbi modelleket a kódolási és agentikus feladatokban.
(Antropikus)
Talán még ennél is fontosabb, hogy a vállalat azt állítja, hogy a Sonnet 4.5 a legbiztonságosabb AI rendszere, a modell „kiterjedt” biztonsági képzésen ment keresztül. Ez a képzés egy chatbot antropikus azt jelenti, hogy „lényegesen” kevésbé hajlamos a „szkofánságra, megtévesztésre, hatalomkeresésre és az a hajlandóság, hogy ösztönözze a téveszmék gondolkodást”-az összes lehetséges modelljellemző, amely rendelkezik az utóbbi hónapokban forró vízben landolták az Openai -t– Ugyanakkor az antropikus megerősítette a Sonnet 4.5 védelmét az azonnali injekciós támadások ellen. Az új modell kifinomultságának köszönhetően az antropikus a Sonnet 4.5 -et szabadon bocsátja ki az AI biztonsági szintű 3. keretrendszere alatt, azaz olyan szűrőkkel érkezik, amelyek célja a kémiai, biológiai és nukleáris fegyverek körüli potenciálisan veszélyes kimenetek megakadályozása.
Egy diagram, amely bemutatja, hogy a Sonnet 4.5 hogyan hasonlítja össze a többi határ modellt a biztonsági tesztelés során.
(Antropikus)
A mai bejelentéssel az antropikus az életminőség javítását is bevezeti a Claude termékcsomagon. A kezdéshez a Claude Code, a vállalat népszerű kódoló ügynöke frissített terminál interfészgel rendelkezik, egy új, a Checkpoints néven. Amint valószínűleg kitalálhatja a névből, lehetővé teszik, hogy elmentse az előrehaladást, és visszatérjen egy előző állapotba, ha Claude olyan funky kódot ír, amely nem olyan működik, mint gondolnád. Fájl létrehozása, amely antropikus a hónap elején kezdett elindulniMost már elérhető közvetlenül a chatbot -szal folytatott beszélgetésekben, és ha csatlakozott a Claude várólistához a Chrome -hoz, akkor ma elkezdheti használni a kiterjesztést.
A Sonnet 4,5 API -ára továbbra is 3 dollár / egymillió bemeneti token és 15 dollár ugyanolyan mennyiségű output tokennél. A Sonnet 4.5 szeptemberi szeptemberi szeptemberi felszabadulása az antropikus számára. Csak egy nappal a Microsoft után hozzáadott Claude modelleket a Copilot 365 -hez A múlt héten az Openai befogadott A rivális a legjobb AI-t kínálja a munkával kapcsolatos feladatokhoz.