Prispevek na spletni strani MIT Technology Review poroča o novem glasovno vodenem ChatGPT klepetalnem robotu podjetja OpenAI. Robot, ki temelji na modelu GPT-4o, omogoča bolj naravne pogovore in prepoznavanje različnih tonov glasu. Za zdaj je dostopen omejenemu številu uporabnikov ChatGPT Plus, v jeseni pa bo na voljo vsem naročnikom. OpenAI je vpeljal varnostne ukrepe, da prepreči zlorabo, kot so ustvarjanje lažnih posnetkov glasu. Podjetje načrtuje dodajanje naprednejših funkcij, kot sta video in deljenje zaslona.
Več o vsebini prispevka pa z uporabo virtualnega asistenta NotebookLM:
Glavne teme v prispevku:
- Novi glasovni vmesnik ChatGPT: OpenAI je izdal novo različico svojega ChatGPT bota, ki omogoča interakcijo z uporabniki preko glasu. To predstavlja premik k bolj naravnim in tekočim pogovorom, podobno kot pri glasovnih asistentih, kot sta Siri in Alexa, vendar z veliko širšimi zmožnostmi.
- Tehnologija GPT-4o: Novi glasovni način pogovora poganja OpenAI-jev novi model GPT-4o, ki združuje zmožnosti glasu, besedila in vida. Ta model omogoča, da bot razume različne tone glasu, se odziva na prekinitve in odgovarja na poizvedbe v realnem času.
- Izboljšana naravnost in čustva: Bot je bil treniran, da zveni bolj naravno in uporablja glasove za prenašanje različnih čustev.
- Postopno uvajanje: Funkcija je bila sprva dana na voljo majhni skupini uporabnikov s plačljivim ChatGPT Plus naročninami, nato pa bo na voljo vsem naročnikom ChatGPT Plus jeseni.
- Varnostni ukrepi: OpenAI je uvedel številne varnostne mehanizme, vključno s testiranjem s strani zunanjih strokovnjakov (“red-teamers”), da bi preprečili zlorabo bota, kot je ustvarjanje zvočnih “deepfakeov”. Na voljo so štirje vnaprej določeni glasovi, da preprečijo oponašanje drugih oseb.
- Zavrnitev uporabe glasu Scarlett Johansson: Potem, ko so se pojavile kritike glede podobnosti enega od glasov (imenovanega “Sky”) z glasom igralke Scarlett Johansson, je OpenAI ustavil njegovo uporabo.
- Prihodnje funkcije: OpenAI načrtuje, da bo v prihodnosti vključil še bolj napredne funkcije, kot so video in deljenje zaslona.
Najpomembnejše ideje in dejstva:
- Novi generaciji glasovnih asistentov: Novi ChatGPT glasovni bot je korak naprej v razvoju AI agentov, saj ponuja veliko večje zmožnosti za naravno komunikacijo.
- “The new chatbot represents OpenAI’s push into a new generation of AI-powered voice assistants in the vein of Siri and Alexa, but with far more capabilities to enable more natural, fluent conversations. It is a step in the march to more fully capable AI agents.”
- Realnočasovne interakcije: Model GPT-4o omogoča odzivanje na interakcije v realnem času, kar povečuje uporabnost in naravnost pogovorov.
- “The new ChatGPT voice bot can tell what different tones of voice convey, responds to interruptions, and reply to queries in real time.”
- Varnost je prioriteta: Podjetje je izvedlo obsežna testiranja in uvedlo varnostne mehanizme, da bi preprečilo zlorabo, kot je na primer ustvarjanje zvočnih ponaredkov (deepfakeov).
- “OpenAI says it has tested the model’s voice capabilities with more than 100 external red-teamers, who were tasked with probing the model for flaws.”
- “In a move that aims to prevent the model from being used to create audio deepfakes, for example, it has created four preset voices in collaboration with voice actors. GPT-4o will not impersonate or generate other people’s voices.”
- Odziv na povratne informacije: Podjetje se je odzvalo na povratne informacije glede glasu “Sky” in ga umaknilo iz uporabe.
- “When OpenAI first introduced GPT-4o, the company faced a backlash over its use of a voice called “Sky,” which sounded a lot like the actress Scarlett Johansson… OpenAI has denied were-chosen/> that the voice is Johansson’s but has paused the use of Sky.”
- Prihajajoče nadgradnje: Načrtovana je vključitev naprednejših funkcij, kot sta video in deljenje zaslona, kar bo še dodatno izboljšalo uporabnost bota.
- “Down the line, OpenAI plans to include more advanced features, such as video and screen sharing, which could make the assistant more useful.”
Kratek povzetek:
OpenAI je predstavil novo različico ChatGPT, ki je opremljena z glasovnim vmesnikom, ki ponuja bolj naravno in tekočo interakcijo. Bot uporablja model GPT-4o, ki omogoča razumevanje različnih tonov glasu, odzivanje na prekinjanja in realnočasovno komunikacijo. Podjetje je uvedlo tudi varnostne mehanizme, da bi preprečilo zlorabo. V prihodnosti pa so načrtovane še bolj napredne funkcije.