Home Hír Kipróbáltam a ChatGPT hangmódját. Most meg vagyok győződve arról, hogy a gépelés...

Kipróbáltam a ChatGPT hangmódját. Most meg vagyok győződve arról, hogy a gépelés időpocsékolás

16
0

Éveket töltöttem azzal, hogy frusztráltak a hangasszisztensek. Ismered a gyakorlatot: félbeszakítják a gondolataidat, vagy teljesen összezavarja a kérést, és végül mégis csak megragadja a telefont, hogy beírja. Tehát amikor kipróbáltam a ChatGPT hangmódját, őszintén szólva a padlón voltak az elvárásaim.

Még soha nem örültem ennyire annak, hogy teljesen tévedtem.

Ez nem csak egy hang-szöveg funkció; olyan érzés, mint egy igazi, gördülékeny beszélgetés. Intelligensen várja, hogy befejezze a gondolatát, megérti a természetes szüneteket, és nem riasztja el az „um” vagy a dadogás. Használhatom főzés vagy vezetés közben, úgy beszélek, mint egy normális ember, anélkül, hogy minden szavamat gondosan megtervezném. Ez nem csak gyorsabb, mint a gépelés – ez egy valóban intuitívabb és hasznosabb módja az AI-val való interakciónak. Ha figyelmen kívül hagytad, akkor lemaradsz.

Ne hagyd ki: Mi az a ChatGPT? Minden, amit az AI Chatbotról tudni kell

ChatGPTaz OpenAI-tól, nem az egyetlen chatbot kihangosítva megy. Google-é Gemini Live ugyanazt a „beszélj át rólam, és én is lépést tartok” hangulatot kínál. Az antropikus Claude mobilalkalmazásaiban a hangmód béta verziója van, kiegészítve a képernyőn megjelenő pontokkal, miközben beszél, és A zavarodottság Az iOS- és Android-asszisztens a felszólaló kérdésekre is válaszol, és parancsra indít olyan alkalmazásokat, mint az OpenTable vagy az Uber.

Ne hagyja ki elfogulatlan műszaki tartalmainkat és laboratóriumi értékeléseinket sem. Adja hozzá a CNET-t preferált Google-forrásként.

De még akkor is, ha mindenki a valós idejű mesterséges intelligencia beszélgetések elsajátításáért küzd, a ChatGPT továbbra is a kedvencem marad. Bármelyik csevegőbotot is választja, tartson egy kis szünetet a gépelésben, és próbálja ki a hangos opciót. Sokkal hasznosabb, mint gondolnád.

(Közzététel: A Ziff Davis, a CNET anyavállalata áprilisban pert indított az OpenAI ellen, azt állítva, hogy megsértette a Ziff Davis szerzői jogait az AI-rendszerek képzése és üzemeltetése során.)

Nézze meg ezt: A ChatGPT vírusos funkciója: Emberek alakítása akciófigurákká

01:19 Mi is pontosan a hangmód?

A hangcsevegés (vagy „hangbeszélgetés”) a ChatGPT kihangosító üzemmódja, amely lehetővé teszi, hogy beszéljen az AI-modellhez, és hallja, ahogyan visszabeszél önnek, nincs szükség gépelésre. Van egy hangikon, amelyet a mobil-, asztali és webalkalmazásban minden olyan beszélgetés jobb alsó sarkában talál, amelyben részt vesz. Ha megnyomja a gombot, hangosan elmondhatja kérdését, és a ChatGPT átírja, megindokolja és válaszol. Amint befejezi a beszédet, újra hallgatni kezd, természetes oda-vissza párbeszédet hozva létre.

Ne feledje: A hangmód ugyanazon a nagy nyelvi modellen fut, mint a hagyományos ChatGPT, így továbbra is hallucinálhat vagy félrevezetheti a tényeket. Mindig ellenőriznie kell minden fontos dolgot.

Az OpenAI ezeknek a hangbeszélgetéseknek két változatát kínálja: a Standard Voice-t (az ingyenes alapértelmezett, könnyű opció) és az Advanced Voice-t (csak fizetős felhasználók számára érhető el).

A Standard Voice először szöveggé alakítja a beszédet, és feldolgozza a GPT-4o-val (és a GPT-4o minivel), így egy kicsit tovább tart a visszabeszélés. Az Advanced Voice viszont natívan multimodális modelleket használ, vagyis „hall” és hangot generál, így a beszélgetés természetesebb és valós időben zajlik. A szavakon kívül más jeleket is fel tud venni, például a beszéd sebességét vagy a hangjában megjelenő érzelmeket, és ehhez alkalmazkodik.

Megjegyzés: Az ingyenes felhasználók hozzáférhetnek az Advanced Voice napi előnézetéhez.

A Nelson Aguilar/CNET7 azt okolja, hogy érdemes elkezdenie használni a ChatGPT hangmód funkcióját

1. Őszintén beszélgetős
A gépeléssel ellentétben, amikor a ChatGPT-vel beszélek, nem a megfelelő szót keresem, vagy minden elgépelés után visszalépek. Csak úgy beszélek, mint bármely baráttal vagy családtaggal, tele „hmmmm”-ekkel, „lájkolással” és egyéb kínos szünetekkel. A Voice mód azonban az összes félkész gondolatommal együtt halad, és vagy egy teljesen kidolgozott válasszal, vagy egy kérdéssel válaszol, hogy segítsen pontosítani, mire van szükségem. Ez a könnyű adok-kapok sokkal természetesebb, mint a gépelés.

2. A ChatGPT-t kihangosítva is használhatja
Nyilvánvalóan továbbra is meg kell nyitnom a ChatGPT alkalmazást, és meg kell érintenem a hangmód gombot az indításhoz, de ha elkezdem, többé nem kell a kezeimet használnom, hogy folytassam a beszélgetést az AI chatbottal. Elakadhatok a forgalomban, és kitalálhatok egy nyaralást, amelyet még idén ki szeretnék tölteni. A telefonom érintése nélkül kérdezhetek repülőjáratokról, szállodákról, tereptárgyakról, éttermekről és bármi másról, és ez a beszélgetés az alkalmazáson belül elmentésre kerül, így nem kell mindenre emlékeznem, amit a ChatGPT mond.

3. Valós idejű fordítással új nyelv tanulására jó
Korábban említettem, hogy a hangmódot használom a nyelvek gyakorlására, amiben a hangmód kiváló. Tudok angolul beszélni, és a ChatGPT hibátlan lengyelül válaszol, kiejtési tippekkel kiegészítve. Csak kérdezze meg a hangmódot: „Segítene gyakorolni a (nyelvemet)”, és a rendszer néhány módszerrel válaszol, amely segíthet Önnek, például a beszélgetés indításához, az alapvető szókincshez vagy a számokhoz. És emlékszik, hol hagytad abba, így bizonyos értelemben leckéket vehetsz; nincs szükség Duolingora.

4. Kapjon választ a való világban látott dolgokra
Ez a funkció kizárólag az Advanced Voice szolgáltatásban érhető el, de valószínűleg ez a kedvenc funkcióm a hangmóddal. Multimodális szuperképességeinek köszönhetően bekapcsolhatom a telefonom kameráját, vagy készíthetek videót/fotót, és megkérhetem a ChatGPT-t, hogy segítsen nekem. Például nehezen tudtam felismerni egy festményt, amelyet egy használtcikk-boltban találtam, és a tulajdonosnak fogalma sem volt, honnan származik. Felvettem a hangos chatet, bekapcsoltam a kamerát, és megkérdeztem a hangmódot, hogy honnan van a festmény. Másodpercek alatt meg tudta mondani a festmény címét, a művész nevét és a festés idejét.

5. Ez egy jobb választás bizonyos fogyatékkal élők számára
A gyengénlátó vagy diszlexiás emberek számára a biztos beszéd felülmúlja a gépelést. A Hang mód képes átírni a beszédet, majd hangosan felolvasni a választ a választott ütemben (ezt módosíthatja a beállításokban, vagy megkérheti a ChatGPT-t, hogy lassítson). A kihangosító opció a motoros készségekkel kapcsolatos problémákkal küzdőknek is segítséget nyújt, mert mindössze egyetlen érintésre van szükség az indításhoz és a leállításhoz egy koppintással, anélkül, hogy hosszasan kell gépelni a billentyűzeten.

6. Gyorsabb ötletbörze
Néha rengeteg ötletem támad, és gyorsabban gondolkodom, mint amennyit tudok gépelni, így a ChatGPT hangmódja tökéletes a történetötletek kiköpésére, a nappalim új elrendezésének kitalálására vagy érdekes ételek elkészítésére a hétre. Mivel a telefonom bámulása helyett hangosan gondolkodom, sokkal könnyebben és gyorsabban folynak az ötleteim, különösen a ChatGPT azonnali nyomon követésével. Segít fenntartani a lendületet, amíg nincs egy csiszolt ötletem, bármit is agyalok.

7. Azonnali összefoglalók, amelyeket meghallgathat
Dobj be a csevegésbe egy 90 oldalas PDF-fájlt, például egy filmforgatókönyvet vagy tankönyvet, kérj összefoglalót, és kérd meg, hogy a mesterséges intelligencia felolvassa neked, miközben hajtogatod a ruhaneműt. Ez olyan, mintha bármilyen dokumentumot (még Wikipédia-oldalakat is csinálok) podcastlá alakítanánk – igény szerint.

A hangmód nem csak egy ügyes trükk; ez egy gyors és természetesebb módja a ChatGPT használatának. Legyen szó utcai táblák fordításáról, ötletelésről vagy a hírekről hangosan értesülve, a ChatGPT-vel való beszélgetés kevésbé olyan, mintha egy chatbotot használna, hanem inkább egy harapásnyi szakértővel. Ha megszokta a hangos gondolkodást, előfordulhat, hogy soha többé nem tér vissza a billentyűzethez.

Fuente de noticias