Cosa può fare GPT-4o di OpenAI?

OpenAI lunedì ha rivelato il suo ultimo modello di punta chiamato GPT-4o (“o” per “omni”), ed è apparentemente quanto di più vicino abbiamo ottenuto ad avere un assistente intelligente come “Jarvis” nel film Iron Man.

Il punto di forza è che ChatGPT-4o può gestire diverse modalità, cosa che la maggior parte dei modelli IA esistenti non può fare. Ciò significa che GPT-4o può accettare e generare qualsiasi combinazione di richieste di testo, audio e immagini.

La demo presentata dal team su X (ex Twitter) è stata così impressionante che molte persone l'hanno esaltata. Una grande caratteristica è che GPT-4o risponde agli input audio in soli 232 millisecondi, che è simile al tempo di risposta umano durante una conversazione.

“Sembra l'intelligenza artificiale dei film; ed è ancora un po' sorprendente per me che sia reale", ha scritto lunedì il CEO di OpenAI Sam Altman in un post sul blog. "Raggiungere tempi di risposta ed espressività a livello umano si rivela un grande cambiamento."

OpenAI ha iniziato a offrire agli utenti le funzionalità di testo e immagini di GPT-4o. Nelle prossime settimane, le funzionalità audio e video verranno rilasciate a “un piccolo gruppo di partner fidati nell’API”, ha affermato la società.

Tuttavia, ecco alcune delle cose che puoi fare con il modello ChatGPT-4o.

Cose che puoi fare con GPT-4o

Crea immagini con testi leggibili

Fino ad ora, alcuni generatori di immagini AI come Midjourney hanno ancora difficoltà a creare immagini con testi leggibili. OpenAI ha affermato che GPT-4o ora comprende molto meglio le descrizioni dei testi e può rendere leggibili i testi sulle immagini.

Fonte immagine: OpenAI

Traduzione in tempo reale

In una situazione in cui è necessario un traduttore, GPT-4o può agire come tale. In una dimostrazione video, il team di OpenAI ha dimostrato che GPT-4o può ripetere qualcosa detto in inglese in spagnolo, forse in altre lingue, e viceversa dallo spagnolo all'inglese.

Guarda e racconta

Per le persone ipovedenti, o semplicemente per divertimento, ChatGPT-4o può guardare e raccontare cosa sta succedendo intorno a te attraverso la fotocamera del telefono. In un caso, la modella è stata in grado di dire a qualcuno che stava festeggiando un compleanno quando ha notato una torta e una candela nella stanza.

Risolvi problemi di matematica

GPT-4o può anche esaminare problemi di matematica su un foglio di carta o su uno schermo e fornire la risposta. Non solo, può anche tutorarti e guidarti per imparare a risolvere il problema.

L'intelligenza artificiale nelle riunioni visive

GPT-4o può partecipare a riunioni visive e organizzare conservazioni con i partecipanti. Può anche aiutare gli utenti a prepararsi per le riunioni di colloquio di lavoro.

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto