Google DeepMind svela l’agente AI che impara in tempo reale

Giovedì Google DeepMind ha presentato SIMA 2, il suo agente di intelligenza artificiale basato sul ragionamento che, secondo l'azienda, si comporta come un essere umano all'interno di mondi virtuali. L'azienda tecnologica ha affermato che SIMA 2 aiuta DeepMind ad andare oltre le semplici azioni sullo schermo e ad avanzare verso un'intelligenza artificiale che pianifica e spiega se stessa, oltre ad apprendere attraverso l'esperienza.

L'azienda ha affermato che il lancio ha segnato un passo significativo verso l'Intelligenza Artificiale Generale (AGI). DeepMind ha inoltre avvertito che SIMA 2 ha importanti implicazioni generali per il futuro della robotica e dell'incarnazione dell'IA.

SIMA 2 pensa da solo e agisce in ambienti interattivi

L'azienda tecnologica ha rilasciato la prima versione di SIMA (Scalable Instructable MultiWorld Agent) a marzo. Google ha affermato che l'agente di intelligenza artificiale ha appreso centinaia di competenze di base osservando lo schermo e utilizzando controlli virtuali con tastiera e mouse. L'azienda ha anche riconosciuto che l'ultima versione dell'agente di intelligenza artificiale fa un ulteriore passo avanti, consentendo all'intelligenza artificiale di pensare autonomamente.

Google DeepMind ha anche rivelato che Gemini è alla base dell'agente di intelligenza artificiale. L'azienda tecnologica ha affermato che l'integrazione di SIMA 2 e Gemini aiuta l'agente di intelligenza artificiale a comprendere gli obiettivi di alto livello dell'utente, a eseguire ragionamenti complessi e a eseguire abilmente azioni orientate agli obiettivi nei giochi.

L'azienda ha affermato che SIMA 2 è l'agente di intelligenza artificiale più potente dell'azienda per i mondi virtuali 3D. DeepMind ha scoperto che interagire con l'agente sembrava più una collaborazione con un compagno razionale che un semplice comando da impartire.

Secondo l'annuncio, SIMA 2 va oltre la semplice esecuzione di istruzioni di base, arrivando a pensare, comprendere e agire in ambienti interattivi. L'agente di intelligenza artificiale consentirà agli utenti di interagire con esso tramite testo, voce o persino immagini.

Google ha affermato che il suo modello di intelligenza artificiale Gemini aiuta SIMA 2 a interpretare obiettivi di alto livello e a illustrare i passaggi che intende intraprendere. L'azienda ha aggiunto che Gemini aiuta il nuovo agente incentrato sull'uomo a collaborare all'interno dei giochi con un livello di ragionamento che il sistema originale non era in grado di raggiungere.

L'azienda tecnologica ha anche segnalato una maggiore generalizzazione negli ambienti virtuali. DeepMind ha confermato che SIMA 2 ha completato compiti più lunghi e complessi, tra cui prompt logici, schizzi disegnati sullo schermo ed emoji. Google ha affermato che questa capacità avvicina le prestazioni di SIMA 2 a quelle di un giocatore umano in una vasta gamma di compiti. L'azienda ha anche osservato che l'agente di intelligenza artificiale ha avuto un tasso di completamento dei compiti del 65%, rispetto al 31% di SIMA 1.

DeepMind ha scoperto che SIMA 2 interpretava le istruzioni e agiva all'interno di mondi 3D completamente nuovi generati da Genie 3. Il progetto, lanciato lo scorso anno, crea ambienti interattivi a partire da una singola immagine o da un prompt di testo. L'azienda tecnologica ha affermato che SIMA 2 era in grado di orientarsi, comprendere gli obiettivi e intraprendere azioni significative in mondi mai visti prima della fase di test.

Google ha sostenuto che l'agente incentrato sull'uomo è ora molto più abile nell'eseguire istruzioni dettagliate, anche in mondi mai sperimentati prima. L'azienda ha affermato che SIMA 2 può trasferire i concetti appresi da un gioco all'altro, collegando i punti tra compiti simili.

DeepMind trova lacune in SIMA 2 che devono essere affrontate

I ricercatori hanno notato che l'agente è passato al gioco autogestito dopo aver appreso dalle dimostrazioni umane. L'agente ha utilizzato il metodo per tentativi ed errori, insieme al feedback generato da Gemini, per creare nuovi dati sull'esperienza. I nuovi dati sull'esperienza includono un ciclo di addestramento in cui SIMA 2 ha provato le attività generate e ha reinserito i propri dati sulla traiettoria nella versione successiva del modello.

Sebbene DeepMind abbia salutato SIMA 2 come un progresso nell'intelligenza artificiale, la ricerca ha anche evidenziato lacune che devono essere colmate. Google ha individuato lacune, tra cui il lavoro con una finestra di memoria limitata, la difficoltà con compiti molto lunghi e articolati e le difficoltà di interpretazione visiva tipiche dei sistemi di intelligenza artificiale 3D.

DeepMind ha rivelato che SIMA 2 è servito da banco di prova per competenze che potrebbero essere utilizzate in robotica e navigazione in futuro. L'azienda ha affermato che la sua ricerca su SIMA 2 offre un solido percorso verso applicazioni in robotica e nell'intelligenza artificiale (AGI) nel mondo reale.

Vuoi che il tuo progetto venga presentato ai più grandi esperti del settore crypto? Presentalo nel nostro prossimo report di settore, dove i dati incontrano l'impatto.

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto