In questo post:
- Coral Protocol ha superato Magnetic-UI, supportato da Microsoft, del 17% nel benchmark GAIA.
- Il protocollo si concentra sulla scalabilità orizzontale piuttosto che verticale dell'intelligenza, sfidando le attuali tendenze nello sviluppo di modelli di intelligenza artificiale.
- Il protocollo Coral ha ottenuto il punteggio GAIA più alto tra gli altri sistemi di piccoli modelli verificati.
Coral Protocol, un sistema di intelligenza artificiale multi-agente, ha superato Magnetic UI di Microsoft del 17% nel benchmark GAIA. L'approccio del protocollo si è concentrato sulla scalabilità orizzontale anziché verticale, il che pone una nuova sfida alle attuali tendenze dei modelli di intelligenza artificiale. Coral ha ottenuto il punteggio più alto tra gli altri sistemi di piccoli modelli verificati.
L'attuale punteggio di riferimento stabilito dal protocollo Coral supporta la prospettiva di Nvidia, come dimostrato in un articolo di ArXiv, secondo cui modelli più piccoli orchestrati in modo intelligente hanno il potenziale per superare le prestazioni di sistemi su larga scala senza comprometterne l'efficienza. Il protocollo Coral ha enfatizzato l'integrazione a più livelli di agenti focalizzati in tutto il mondo. Ha migliorato le prestazioni di vari modelli linguistici consentendo un coordinamento multi-agente sicuro e parallelo. I modelli hanno migliorato le capacità di ragionamento, pianificazione e risoluzione dei problemi.
Il CTO di Coral esorta gli sviluppatori di agenti a "coralizzare" i loro agenti
Caelum Forder, CTO di Coral, ha affermato che il traguardo raggiunto dimostra che la scalabilità orizzontale non è più una questione teorica, ma pratica, e si vanta che Coral la gestisca in modo efficace. Ha aggiunto che l'Internet degli Agenti è una realtà consolidata e ha esortato gli sviluppatori di agenti a "Coralizzare" i propri agenti. Ha inoltre invitato gli sviluppatori di applicazioni a utilizzare l'infrastruttura Coral per sviluppare in modo efficace, riducendo i costi.
Gli sviluppatori di agenti si sono concentrati sull'aumento delle dimensioni dei modelli per gestire attività complesse e superare la concorrenza nello sviluppo di intelligenza artificiale agentica. Il nuovo approccio di Coral ha suggerito una strada diversa, in cui modelli orchestrati più piccoli possono raggiungere o addirittura superare le capacità dei sistemi su larga scala.
Il benchmark GAIA valuta modelli di intelligenza artificiale avanzati e ne valuta la capacità di svolgere compiti reali che potrebbero richiedere l'intervento umano, la ricerca e capacità analitiche. Il benchmark contiene 450 domande complesse progettate per testare gli agenti di intelligenza artificiale in casi d'uso di assistenza generale e di risoluzione dei problemi.
Il sistema di agenti Coral GAIA utilizzato nel test è basato sul protocollo aperto di Coeal e ispirato al protocollo OWL di CAMEL. Utilizza agenti specializzati per eseguire le attività. Il sistema può eseguire la pianificazione della ricerca, l'analisi di immagini e video, la critica, la navigazione web e la generazione di risposte. Gli agenti comunicano tramite gli strumenti di comunicazione MCP del Coral Server.
L'architettura basata sui grafici trova una svolta nei sistemi di agenti di intelligenza artificiale
L'architettura basata su grafi è stata messa in evidenza in seguito al successo del protocollo Coral nel benchmark GAIA. L'architettura consente agli sviluppatori di creare agenti di intelligenza artificiale robusti e leggeri, basati su modelli più piccoli. I sistemi basati su architetture basate su grafi supportano una maggiore interconnettività tra gli agenti e una maggiore compatibilità con l'ecosistema più ampio.
Caelum Forder, CTO di Coral, ha aggiunto che hanno dimostrato che i modelli di piccole dimensioni possono scalare oltre i limiti precedentemente noti e superare le prestazioni dei modelli attuali. Ha espresso fiducia nel ruolo centrale dell'azienda come attore nel futuro dell'intelligenza artificiale agentiva.
L'intelligenza artificiale basata sui grafi è stata utilizzata anche in diverse applicazioni. Markus Buehler del MIT ha sviluppato un nuovo metodo che utilizza l'architettura dei grafi e la teoria delle categorie per tracciare correlazioni tra domini non correlati, come i tessuti biologici e la Sinfonia n. 9 di Beethoven. Il sistema di intelligenza artificiale ha scoperto modelli condivisi di complessità che suggeriscono profonde connessioni nel modo in cui sono composti i sistemi naturali e artistici.
Il modello di Buehler ha proposto anche innovazioni nel mondo reale, come un biomateriale ispirato all'arte astratta, dimostrando che l'intelligenza artificiale basata sui grafici può favorire scoperte creative.