Évek óta használok hangasszisztenseket, és bár segítőkészek voltak, mindig csalódott voltam, amikor félbeszakítottak a mondat közepén, vagy teljesen kihagyták, amit mondok. Nem voltam optimista, amikor kipróbáltam a ChatGPT hangmódját, és még soha nem örültem ennyire annak, hogy tévedtem. A Voice Mode nem csak azt jelenti, hogy beszélek a chatbottal, hanem hiteles beszélgetésnek tűnik.
Felveszi a szüneteket, a motyogott gondolatokat, és még az olyan töltelékszavakat is, mint az „uhhh”, anélkül, hogy megszakítaná az áramlást. Akár vezetek, akár főzök, akár több feladatot próbálok végezni, természetesen tudok beszélni, és hasznos válaszokat kapok anélkül, hogy felemelném a telefont. Nem csak gyorsabb, mint a gépelés – egyszerűbbnek, intuitívabbnak és sokkal hatékonyabbnak tűnik. Ha még nem próbálta ki, a ChatGPT hangmódja ezért válhat a mesterséges intelligencia használatának kedvenc módjává.
Ne hagyd ki: Mi az a ChatGPT? Minden, amit az AI Chatbotról tudni kell
ChatGPTaz OpenAI-tól, nem az egyetlen chatbot kihangosítva megy. Google-é Gemini Live ugyanazt a „beszélj át rólam, és én is lépést tartok” hangulatot kínál. Az antropikus Claude mobilalkalmazásaiban a hangmód béta verziója van, kiegészítve a képernyőn megjelenő pontokkal, miközben beszél, és A zavarodottság Az iOS- és Android-asszisztens a felszólaló kérdésekre is válaszol, és parancsra indít olyan alkalmazásokat, mint az OpenTable vagy az Uber.
Ne hagyja ki elfogulatlan műszaki tartalmainkat és laboratóriumi értékeléseinket sem. Adja hozzá a CNET-t preferált Google-forrásként.
De még akkor is, ha mindenki a valós idejű mesterséges intelligencia beszélgetések elsajátításáért küzd, a ChatGPT továbbra is a kedvencem marad. Bármelyik csevegőbotot is választja, tartson egy kis szünetet a gépelésben, és próbálja ki a hangos opciót. Sokkal hasznosabb, mint gondolnád.
(Közzététel: A Ziff Davis, a CNET anyavállalata áprilisban pert indított az OpenAI ellen, azt állítva, hogy megsértette a Ziff Davis szerzői jogait az AI-rendszerek képzése és üzemeltetése során.)
Nézze meg ezt: A ChatGPT vírusos funkciója: Emberek alakítása akciófigurákká
01:19 Mi is pontosan az a hangmód?
A hangcsevegés (vagy „hangbeszélgetés”) a ChatGPT kihangosító üzemmódja, amely lehetővé teszi, hogy beszéljen az AI-modellhez, és hallja, ahogyan visszabeszél önnek, nincs szükség gépelésre. Van egy hangikon, amelyet a mobil-, asztali és webalkalmazásban minden olyan beszélgetés jobb alsó sarkában talál, amelyben részt vesz. Ha megnyomja a gombot, hangosan elmondhatja kérdését, és a ChatGPT átírja, megindokolja és válaszol. Amint befejezi a beszédet, újra hallgatni kezd, természetes oda-vissza párbeszédet hozva létre.
Ne feledje: A hangmód ugyanazon a nagy nyelvi modellen fut, mint a hagyományos ChatGPT, így továbbra is hallucinálhat vagy félrevezetheti a tényeket. Mindig ellenőriznie kell minden fontos dolgot.
Az OpenAI ezeknek a hangbeszélgetéseknek két változatát kínálja: a Standard Voice-t (az alapértelmezett, könnyű opció ingyenesen) és az Advanced Voice-t (csak fizetős felhasználók számára érhető el).
A Standard Voice először szöveggé alakítja a beszédet, és feldolgozza a GPT-4o-val (és a GPT-4o minivel), így egy kicsit tovább tart a visszabeszélés. Az Advanced Voice viszont natívan multimodális modelleket használ, vagyis „hall” és hangot generál, így a beszélgetés természetesebb és valós időben zajlik. A szavakon kívül más jeleket is fel tud venni, például a beszéd sebességét vagy a hangjában megjelenő érzelmeket, és ehhez alkalmazkodik.
Megjegyzés: Az ingyenes felhasználók hozzáférhetnek az Advanced Voice napi előnézetéhez.
félelem
A Nelson Aguilar/CNET7 azt okolja, hogy érdemes elkezdenie használni a ChatGPT hangmód funkcióját
1. Őszintén beszélgetős
A gépeléssel ellentétben, amikor a ChatGPT-vel beszélek, nem a megfelelő szót keresem, vagy minden elgépelés után visszalépek. Csak úgy beszélek, mint bármely baráttal vagy családtaggal, tele „hmmmm”-ekkel, „lájkolással” és egyéb kínos szünetekkel. A Voice mód azonban az összes félkész gondolatommal együtt halad, és vagy egy teljesen kidolgozott válasszal, vagy egy kérdéssel válaszol, hogy segítsen pontosítani, mire van szükségem. Ez a könnyű adok-kapok sokkal természetesebb, mint a gépelés.
2. A ChatGPT-t kihangosítva is használhatja
Nyilvánvalóan továbbra is meg kell nyitnom a ChatGPT alkalmazást, és meg kell érintenem a hangmód gombot az indításhoz, de ha elkezdem, többé nem kell a kezeimet használnom, hogy folytassam a beszélgetést az AI chatbottal. Elakadhatok a forgalomban, és kitalálhatok egy nyaralást, amelyet még idén ki szeretnék tölteni. A telefonom érintése nélkül kérdezhetek repülőjáratokról, szállodákról, tereptárgyakról, éttermekről és bármi másról, és a beszélgetést az alkalmazás menti, így nem kell mindenre emlékeznem, amit a ChatGPT mond.
3. Valós idejű fordítással új nyelv tanulására jó
Korábban említettem, hogy a hangmódot használom a nyelvek gyakorlására, amiben a hangmód kiváló. Tudok angolul beszélni, és a ChatGPT hibátlan lengyelül válaszol, kiejtési tippekkel kiegészítve. Csak kérdezze meg a hangmódot: „Segítene gyakorolni a (nyelvemet)”, és a rendszer néhány módszerrel válaszol, amely segíthet Önnek, például a beszélgetés indításához, az alapvető szókincshez vagy a számokhoz. És emlékszik, hol hagytad abba, így bizonyos értelemben leckéket vehetsz; nincs szükség Duolingora.
4. Kapjon választ a való világban látott dolgokra
Ez a funkció kizárólag az Advanced Voice szolgáltatásban érhető el, de valószínűleg ez a kedvenc funkcióm a hangmóddal. Multimodális szuperképességének köszönhetően bekapcsolhatom a telefonom kameráját, vagy készíthetek videót/fotót, és megkérhetem a ChatGPT-t, hogy segítsen nekem. Például nehezen tudtam felismerni egy festményt, amelyet egy használtcikk-boltban találtam, és a tulajdonosnak fogalma sem volt, honnan származik. Felvettem a hangos chatet, bekapcsoltam a kamerát, és megkérdeztem a hangmódot, hogy honnan van a festmény. Másodpercek alatt meg tudta mondani a festmény címét, a művész nevét és a festés idejét.
5. Ez egy jobb választás bizonyos fogyatékkal élők számára
A gyengénlátó vagy diszlexiás emberek számára a biztos beszéd felülmúlja a gépelést. A Hang mód képes átírni a beszédet, majd hangosan felolvasni a választ a választott ütemben (ezt módosíthatja a beállításokban, vagy megkérheti a ChatGPT-t, hogy lassítson). A kihangosító opció a motoros készségekkel kapcsolatos problémákkal küzdőknek is segítséget nyújt, mert mindössze egyetlen érintésre van szükség az indításhoz és a leállításhoz egy koppintással, anélkül, hogy hosszasan kell gépelni a billentyűzeten.
6. Gyorsabb ötletbörze
Néha rengeteg ötletem támad, és gyorsabban gondolkodom, mint amennyit tudok gépelni, így a ChatGPT hangmódja tökéletes a történetötletek kiköpésére, a nappalim új elrendezésének kitalálására vagy érdekes ételek elkészítésére a hétre. Mivel a telefonom bámulása helyett hangosan gondolkodom, sokkal könnyebben és gyorsabban folynak az ötleteim, különösen a ChatGPT azonnali nyomon követésével. Segít fenntartani a lendületet, amíg nem kapok egy csiszolt ötletet, bármit is agyalok.
7. Azonnali összefoglalók, amelyeket meghallgathat
Dobj be a csevegésbe egy 90 oldalas PDF-fájlt, például egy filmforgatókönyvet vagy tankönyvet, kérj összefoglalót, és kérd meg, hogy a mesterséges intelligencia felolvassa neked, miközben hajtogatod a ruhaneműt. Ez olyan, mintha bármilyen dokumentumot (még Wikipédia-oldalakat is csinálok) podcastlá alakítanánk – igény szerint.
A hangmód nem csak egy ügyes trükk; ez egy gyors és természetesebb módja a ChatGPT használatának. Legyen szó utcai táblák fordításáról, ötletelésről vagy a hírekről hangosan értesülve, a ChatGPT-vel való beszélgetés kevésbé olyan, mintha egy chatbotot használna, hanem inkább egy harapásnyi szakértővel. Ha megszokta a hangos gondolkodást, előfordulhat, hogy soha többé nem tér vissza a billentyűzethez.









