OpenAI ha ritardato il rilascio della nuova funzionalità della modalità vocale, adducendo motivi di sicurezza. La società prevede di effettuare ulteriori test di sicurezza sulla funzionalità prima di rilasciarla ai propri utenti. L’azienda ha rivelato la funzionalità il mese scorso.
Leggi anche: Coinbase dona 25 milioni di dollari per votare i politici anti-cripto
La modalità vocale ha suscitato polemiche per il suo realismo preoccupante e per il presunto utilizzo di Scarlett Johansson per sviluppare una voce che riflettesse il suo personaggio nel film " Her ". L'azienda ha dimostrato per la prima volta la funzionalità della modalità vocale espressiva per ChatGPT a maggio. Ha anche dimostrato di poter leggere le espressioni facciali e impegnarsi in vivaci chat in tempo reale. L'azienda di intelligenza artificiale prevede di rilasciare la funzionalità vocale in un test alfa per un determinato gruppo di utenti ChatGPT Plus entro giugno.
Saluta GPT-4o, il nostro nuovo modello di punta che può ragionare su audio, visione e testo in tempo reale: https://t.co/MYHZB79UqN
L'input di testo e immagini sarà disponibile oggi in API e ChatGPT con voce e video nelle prossime settimane. pic.twitter.com/uuthKZyzYx
– OpenAI (@OpenAI) 13 maggio 2024
OpenAI svela i motivi del ritardo
La società ha affermato che la funzione vocale aveva bisogno di un mese in più per perfezionare la sua produzione prima di essere lanciata a tutti i membri Plus in autunno. La funzionalità vocale è stata forse l’annuncio più importante durante l’evento di lancio, svelata insieme a ChatGPT-40 , l’ultima funzionalità del modello linguistico di grandi dimensioni. I dipendenti di OpenAI hanno mostrato la modalità vocale, impegnandosi in conversazioni dal suono naturale.
Al momento dell'annuncio, la società ha dichiarato: “La modalità vocale avanzata di ChatGPT è in grado di comprendere e rispondere con emozioni e segnali non verbali, avvicinandoci a conversazioni naturali in tempo reale con l'intelligenza artificiale. La nostra missione è offrirti queste nuove esperienze con attenzione,"
La presentazione invitava a confrontare la modalità vocale con " Her ", il film di fantascienza che presentava un partner virtuale doppiato da Scarlett Johansson. L'attrice ha presto minacciato di denunciare OpenAI per aver utilizzato una voce simile alla sua nel film. Alla fine la società dichiarò che si sarebbe sbarazzata della voce dal suo catalogo. A quanto pare, questa minaccia legale potrebbe essere uno dei motivi che hanno portato al suo rinvio.
Condividiamo un aggiornamento sulla modalità vocale avanzata di cui abbiamo presentato una demo durante il nostro aggiornamento di primavera, di cui siamo molto entusiasti:
Avevamo pianificato di iniziare a distribuirlo in versione alpha per un piccolo gruppo di utenti ChatGPT Plus alla fine di giugno, ma abbiamo bisogno di un altro mese per raggiungere il livello previsto per il lancio.…
– OpenAI (@OpenAI) 25 giugno 2024
L'azienda di intelligenza artificiale ha dichiarato varie ragioni per rinviare il rilascio, una delle quali è quella di migliorare l'esperienza dell'utente garantendo che la funzionalità possa rilevare e rifiutare di impegnarsi in determinate conversazioni. OpenAI afferma inoltre che sta preparando la propria infrastruttura per gestire i milioni di membri che intendono utilizzare la nuova funzionalità vocale.
"Ad esempio, stiamo migliorando la capacità del modello di rilevare e rifiutare determinati contenuti", ha affermato OpenAI.
Gli utenti di ChatGPT esprimono la loro insoddisfazione
Una parte degli utenti di ChatGPT Plus ha messo in dubbio il valore del proprio abbonamento premium poiché non erano in grado di usufruire delle funzionalità promesse. Alcuni critici si sono affrettati a notare la storia dell'azienda di promesse eccessive e di mancato rispetto delle promesse.
In effetti, alcuni membri di ChatGPT Plus hanno suggerito che sia il momento migliore per terminare il proprio abbonamento premium. Un altro utente ha rivelato di aver scelto di annullare la propria iscrizione. Alcuni osservatori della comunità AI ritengono che la modalità vocale potrebbe essere disponibile tra pochi mesi.
Reporting criptopolita di Collins J. Okoth