Vibe kódolás nagyon szórakoztató lehet megfelelő gondolkodásmóddal. Csak az ötletre és chatbotok mint például Claude, Ikrek és a ChatGPT működőképes kódot generálhat az Ön utasításai alapján. Elég sok időt töltöttem hangulatkódolással eseménynaptárak és retro játékok csak úgy, hogy csevegünk vele LLM-ekés egy világot nyithat meg az emberek előtt, akik soha nem gondolták, hogy képesek lesznek valamit létrehozni a kódból.
A használt modell azonban drámai hatással lehet a projekt kimenetének minőségére. Meg akartam nézni, hogy a könnyebb modellek hogyan viszonyulnak a „gondolkodó” modellekhez, ahogy a Google és az OpenAI hivatkozik rájuk. Ezek a könnyebb modellek elnevezésükben különböznek: a Google Gemini felülete Fast-nak hívja (bár a modellt valójában például Gemini 2.5 Flash-nek hívják), míg az OpenAI Instant-nek hívja.
Hogy átérezhessem, mennyire különbözőek az egyes modellek a hangulatkódoláshoz, úgy döntöttem, hogy elvégzek egy laza kísérletet. Kezdtem azzal, hogy létrehoztam egy projektet a Gemini gondolkodási modelljével — a Gemini 3 Pro -val, majd meg akartam nézni, hogy meg tudnám-e reprodukálni ugyanazt a projektet a gyors modellel az előző projekt azonos promptjainak felhasználásával. Tekintettel arra, hogy nem lehet garantálni az egyes modellekre adott válaszokat, tudtam, hogy lesznek eltérések, és a beszélgetések elágazódnak, de a legtöbb esetben mindkét projekthez azonos felszólításokat használtam.
A tesztelés idején a gyors modell a Gemini 2.5 Flash volt. Arra számítottam, hogy a végeredmény más lesz, és azok is voltak, de közel sem annyira, mint vártam. Különös volt az, hogy minden modellnél hogyan jutottam el A-tól Z-ig.
Nem igazán tudtam, hol kezdjem a projektemet, ezért megkértem a Geminit, hogy találjon ki néhány érdekes hangulatkódolási projektet számomra. Az egyik egy „Trófea vitrin” volt, és ezt vettem kiindulási pontnak. Megkértem a Geminit, hogy a trófeák helyett jelenítse meg a horrorfilmek listáját, és adjon meg több információt róluk, amikor az egyik plakátra kattintott. E követelményeken kívül mindkét Gemini modellnek kreatív irányítást adtam.
Ne hagyja ki elfogulatlan műszaki tartalmainkat és laboratóriumi értékeléseinket sem. Adja hozzá a CNET-t preferált Google-forrásként.
Gyors és gondolkodó AI modellek: Mi a különbség?
Ha a Google választást ad a Flash és a Pro modellek között, akkor ezeknek lényegesen különbözniük kell, nem? Igen és nem. Mindkettő nagy nyelvi modell, de eltérően működnek. A mindennapi felhasználó számára a „gyors” és a „gondolkodás” elég jól meghatározza a kettő közötti különbséget: sebesség és mélység.
A érvelési modell egy LLM, amelyet úgy finomítottak, hogy az összetett problémákat kisebb lépésekre bontja, mielőtt létrehozná a végső kimenetet. Ez egy belső gondolati láncolat végrehajtásával történik. A Gemini 2.5 Flash és a Gemini 3 Pro is okos modell, de a Gemini 2.5 Flash is hibrid megközelítés: Kínál a egyensúlyozó aktus sebesség és érvelés között.
A Gemini 3 Pro az erősebb érvelési modell, és arra van optimalizálva, hogy mélyre merüljön a válaszok megtalálása érdekében. Ennek eredményeként lassabb, mint a hatékonyabb modellek, például a 2.5 Flash. A Google azóta kiadta Gemini 3 Flashegy erősebb alapmodell, amely a 2.5 Flash-t váltotta fel. A Gemini 3 Pro továbbra is a legtöbb ember számára elérhető legerősebb gondolkodási modell a Geminiben.
A Gemini 3 Pro modellel könnyebb dolgozni a Flash-hez képest
A Gemini 3 Pro végső projektje nem volt tökéletes, de jobb volt, mint az eredeti ötletem, és körülbelül egy mérfölddel megelőzte azt, amit a Gemini 2.5 Flash produkált.
Google Gemini/Screenshot Blake Stimac/CNET
A Gemini 3 Pro segítségével létrehozhattam egy nyitóoldalt, amely bemutatta a listámon szereplő filmeket, poszterképekkel kiegészítve, és amikor egy címre kattintott, megnyílik egy oldal, és további információk jelennek meg, valamint a YouTube-on található előzetes megtekintésére szolgáló link. Nem volt bonyolult projekt, de rengeteg problémába és hibába ütköztem az út során.
Eredetileg azt akartam, hogy az előzetesek be legyenek ágyazva az oldalba, de folyamatosan jelezte azokat a hibákat, amelyeket a Gemini nem tudott kijavítani, így a méret visszalépését eredményezte, pusztán egy linkelt kép megadásával, hogy megnézhesse az előzetest a YouTube-on. Jó volt, de kevésbé zökkenőmentes élmény, mint szerettem volna. Ennek ellenére nagyra értékeltem, hogy a Gemini 3 Pro milyen konkrét problémákat mutatott fel ezzel a funkcióval, és lehetővé tette számomra, hogy meghozzam a döntést a megszüntetéséről.
Egy másik probléma, amelyet a Gemini 3 Pro többször megpróbált kijavítani, az volt, amit rétegezési problémaként írt le. Ha egy poszterre kattint, megjelenik egy felugró ablak a film részleteivel, valamint egy kis gomb a nézetből való kilépéshez, bár ez soha nem működött. Négyszer kértem a Geminit, hogy javítsa ki, és az utolsó kérésig nem tudta megoldani a problémát. Az Ikrek nagy vonalakban elmagyarázta, mit csinál a kóddal, de soha nem ment bele túlságosan a részletekbe, bár azt képzelném, hogy konkrétumokkal szolgált volna, ha megkérdezem.
Az eredeti projekt egyszerűen a filmek gyűjteményének megjelenítésére és róluk való további információk megszerzésére szolgált. Ezen kívül semmit sem gondoltam a stílusra vagy a webalkalmazás érdekessé tételére, és a Gemini 3 Pro hasznos volt ezen a területen. Amikor megkérdeztem, hogyan tudnám jobbá tenni az alkalmazást, mind a dizájn, mind a funkciók tekintetében, azt javasolta, hogy adjunk hozzá egy 3D-s kerékeffektust a filmekhez, és egy véletlenszerű választási lehetőséget.
Ez a projekt közel 20 iterációt vett igénybe. A végtermék nagyjából olyan jó volt, mint amilyennek készült, és ez egy szórakoztató projekt volt, de voltak olyan problémák, amelyeket a Gemini gyakran nem tudott kijavítani. A végtermék jobban teljesített, mint amire számítottam, így elégedett voltam vele. De az összes felmerült probléma mellett elkezdtem azon tűnődni, hogy a gyors Gemini modell hogyan fogja kezelni ugyanazt a projektet.
A Vibe kódolás a Gemini 2.5 Flash-el inkább manuális
Nem meglepő módon a „gyors” modell használata gyorsabb volt, mint a Gemini 3 Pro, de ez a modell gyakran több manuális megközelítést javasolt a projekt megoldásához. Az AI gyorsan működött, de több – és lassabb – munkát hozott létre számomra.
Például azt akartam, hogy a webalkalmazás megjelenítse a listán szereplő egyes filmek poszterét és szinopszisát, de soha nem gondoltam arra, hogy ezek az információk hogyan jönnek létre. Külön kérés nélkül a Gemini 3 Pro azt javasolta, hogy regisztrálhatnék A filmes adatbázis és kap egy API-kulcsot, amely automatikusan beírja ezeket a részleteket, ahol a Gemini 2.5 Flash lényegében azt mondta, hogy „szerezzem be” a képeket, és menjek onnan. Az, hogy ezeket a képeket hogyan szereztem, látszólag rajtam múlott.
A Gemini 2.5 Flash néha szinte lustának érzi magát a Gemini 3 Pro-hoz képest. Vannak olyan dolgok, amelyeket a Gemini Pro modell kérés nélkül is megtesz, de a Flash-nek pontosabb felszólításra van szüksége. Időnként olyan érzésem volt, mintha egy gyereket kérnék, aki hallotta az utasításokat, de szándékosan elkerülte a házimunkát.
Több esetben, miután megkértem a Gemini 2.5 Flash-t, hogy hajtson végre változtatást, ezt megtette, és megadta a frissített kódot, de csak az általa módosított szakaszhoz. Ezután utasítana, hogy cseréljem ki a régi kódot az új kódra. Ha tudod, hogy mit keresel, valószínűleg nem olyan nagy dolog a kód egyik szakaszának cseréje egy másikkal, de ez egy hangulatos kódolás, és ha nem tudod, hova helyezd el a kódot, még ha ez valóban könnyű feladat is, akkor néhány embert megállíthat a pályán. Feldobhatja a hangulatot.
Sőt, a Gemini 2.5 Flash egyszerűen azt javasolta, hogy „szerezzem meg” a filmplakát képeket és további részleteket. Tehát, miközben áttörtem a kísérleti paraméterek határait, hogy mindkét projektben csak ugyanazokat a promptokat használjam (amelyek a legjobb esetben is lazaak voltak), úgy döntöttem, hogy megkérdezem a Gemini 2.5 Flash-t, mi a véleménye a The Movies Database API-kulcsának hozzáadásának ötletéről. Üdvözölte az ötletet, és megmondta, hová tegyem a kulcsot. Ehelyett megkértem a modellt, hogy adja hozzá az általam megadott kulcsot. Hozzáadta a kulcsot, de amikor futtattam a webalkalmazást, valójában nem poszterképeket húzott le az általam felsorolt filmekből, így ismét meg kellett kérnem, hogy javítsa ki. A modell a korlátaira utalt, mondván: „Az eredeti listán szereplő összes film pontos TMDB azonosítójának megtalálása időigényes, de a tömböt a lehető legtöbb megerősített azonosítóval fogom feltölteni, hogy a gyűjtemény pontosan megfeleljen a kért listának.”
Ha csinált valamit, amit mondott, akkor nem vettem észre. Összehasonlítva a különféle filmek vad tömbjével, az általam megadott listán szereplő egyezések véletlennek tűntek. Mégis, annak ellenére, hogy a filmes poszterek 99%-a helytelen volt, ez még mindig megakadályozott abban, hogy maguknak a képeknek kellett volna kézzel hozzáadnom, elméletileg. Ezzel szemben a Gemini 3 Pro egy felvételben feltöltötte az összes megfelelő filmplakátot.
Hogyan különböztek a gyors és a gondolkodó modellek a hangulatkódolás során
Minden alkalommal, amikor kiigazítást kértem a Gemini gondolkodási modelljétől, az végrehajtotta a változtatást, és azonnal átírta az összes kódot, így egyszerűen másolhattam és beilleszthetném a teljes kódot bárhová, anélkül, hogy tudnám, hol frissítették a kódot.
A Gemini 2.5 Flash más volt. Egy ponton, egy kisebb módosítás után, megadta a kódot, és azt mondta, hogy cseréljem ki arra, ami ott van. Remélve, hogy ezt elkerülhetem, megkértem, írja át a teljes kódot, hogy ne kelljen semmit módosítanom. A válasz: „Ez egy hatalmas kérdés.” Bár úgy tűnt, azt hitte, hogy abban a pillanatban sokkal többet kérek tőle, ez egy kicsit felkavaró a Gemini 3 Pro-hoz képest.
A projektek
A Gemini 2.5 Flash valamennyire működőképes projektet hozott, de még a hibák kijavítása után is tele volt hibákkal.
Google Gemini/Screenshot Blake Stimac/CNET
A tesztelésem végén egyik modell sem volt tökéletes, de a Gemini 3 Pro-val sokkal könnyebb volt dolgozni. Míg egy másik projektben mindkét modell nagyon hasonló eredményeket hozhat, a végső cél elérése valószínűleg két nagyon eltérő utat fog megtenni.
A Gemini 2.5 Flash használatával konkrétan meg kell határoznia, hogy mit szeretne tenni, és készen kell állnia a javításra, ha úgy tűnik, hogy parancsikonokra van szükség. Gyakorlatra és tapasztalatra van szükség, beleértve a más mesterséges intelligencia modellekkel való munkát is, hogy észrevegyük, ha a modell olyan parancsikont használ, amely hatással lehet a projektre. Ha ez az egyetlen modell, amellyel dolgozik, akkor összességében szorgalmasabbnak kell lennie.
A Gemini 3 Pro valóban megérdemli a nevét. Nemcsak megbirkózott a nehéz terhekkel a projekttel kapcsolatban, de hasznos javaslatokat is kínált, amelyek kiemelték az alapötletből, amellyel elkezdtem.









