Google ha reso disponibile gratuitamente a tutti gli utenti Android la sua funzionalità di chatbot AI a comando vocale, Gemini Live. La funzionalità, che consente agli utenti di parlare con il Chatbot AI di Google tramite comandi vocali, era precedentemente completamente disponibile per gli abbonati Gemini Advanced.
La nuova funzionalità consente a tutti gli utenti Android di utilizzare le funzioni di dialogo del chatbot che ora includono il porre domande tramite voce e l'interruzione delle risposte nel processo.
Questo annuncio arriva dopo il primo lancio dell'applicazione Gemini Live il mese scorso all'evento Pixel 9 di Google. Gli utenti Android possono ora abilitare facilmente la funzione direttamente premendo l'icona di una forma d'onda all'interno dell'applicazione Gemini che consente loro di iniziare a utilizzare le interazioni vocali con l'intelligenza artificiale. Il lancio arriva in un momento in cui la funzionalità concorrente di Open AI, Advanced Voice Mode per ChatGPT, non è stata ancora completamente implementata.
Gli utenti possono ora accedere alla modalità vocale di Gemini con maggiore controllo
La funzionalità più notevole di Gemini Live include la possibilità per gli utenti di porre domande ad alta voce, interrompere le risposte nel mezzo di una frase e scegliere voci diverse per le risposte dell'IA. Questa funzionalità vivavoce aggiunge un certo grado di flessibilità e personalizzazione, rendendo le conversazioni con l'intelligenza artificiale più fluide e reattive. Oltre a gestire la discussione in tempo reale, i partecipanti possono anche “trattenere” le risposte o “terminare” la conversazione in qualsiasi momento quando richiesto.
Sebbene inizialmente la capacità di controllo vocale fosse una caratteristica di un servizio a pagamento, questa funzionalità vocale è ora disponibile nella versione gratuita dell'applicazione Gemini. Gli utenti Android possono iniziare a utilizzare l'app o l'overlay per accedervi immediatamente. Attualmente, la modalità vocale è ottimizzata solo per supportare la lingua inglese, tuttavia, Google ha confermato l'intenzione di aggiungere più lingue e rendere questa funzionalità disponibile anche sui dispositivi iOS, sebbene non sia stata fornita una tempistica esatta.
Google lancia Gemini Live poiché la funzionalità vocale di OpenAI è in ritardo
I tempi di questo lancio mettono Google davanti a OpenAI, che a maggio ha reso nota la sua modalità vocale avanzata per ChatGPT. Tuttavia, questa funzionalità offerta da Open AI non è stata ancora resa ampiamente disponibile, essendo diventata disponibile in modo limitato dalla fine di luglio. Altri addetti ai lavori del settore hanno inoltre suggerito che il lungo periodo di attesa potrebbe essere dovuto all’elevata potenza di calcolo necessaria per supportare le interazioni AI basate sulla voce, soprattutto su larga scala.
La mossa di Google di lanciare Gemini Live gratuitamente contrasta con il rilascio scaglionato di OpenAI di una funzionalità simile. Mentre OpenAI continua a sviluppare una strategia per un'adozione più ampia, il rilascio di Google mette Gemini Live nelle mani degli utenti desiderosi di interagire con l'intelligenza artificiale parlando anziché digitando, rendendo questo un vantaggio competitivo tra le due società.
Attualmente, Gemini Live è accessibile su dispositivi Android e Google prevede di aggiungere ulteriori funzionalità man mano che sviluppa il servizio.