OpenAI bejelentette hogy hogyan változik A ChatGPT hangmódja működik az interneten és a vállalati alkalmazáson belül. A frissítés részeként közvetlenül a folyamatban lévő csevegésen belül kommunikálhat a ChatGPT Voice-szal, így láthatja az OpenAI mesterséges intelligencia modelljével folytatott beszélgetésének átiratát, valamint olyan látványelemeket, amelyek bemutatják, miről is beszél a ChatGPT.
Hangcsevegést indíthat egyszerűen a ChatGPT szövegmezője melletti „hullámforma” ikonra koppintva vagy rákattintva. Ahelyett, hogy elindulna az eredeti gömbbel töltött felület a funkció úgy indult, hogy a hangos csevegés a korábban megbeszéltekkel összhangban történik. A bejelentés mellett megosztott OpenAI bemutató videóban a ChatGPT megjeleníthette a beszélgetés átiratát, majd egy térképet, amely a népszerű pékségeket és a Tartine-ban árult péksütemények fotóit tartalmazza. Az OpenAI azt mondja, hogy ha az eredeti Voice felületet részesíti előnyben, visszaválthat rá, ha a ChatGPT beállításainak Hangmód szakaszában kapcsolja be a Külön módot.
A vizuális és hangos válaszok kombinálása a ChatGPT multimodális jellegének természetes kiterjesztése. Az OpenAI modelljét máris kérheti hangjával, képével vagy videójával, logikus, hogy a ChatGPT hangválaszainak ugyanolyan részletességűnek kell lenniük. A Google hasonló készítési módszereket vizsgált Gemini Live kifejezőbb a beszélgetések során, beleértve azt is, hogy a mesterséges intelligencia rátétekkel kiemeli az élő videó egyes részeit. Ez az OpenAI-funkció nem teljesen reaktív ugyanilyen módon, de informatívabbá teheti a ChatGPT-vel folytatott hangbeszélgetést.









