L’intelligenza artificiale è a un punto di svolta. Mentre l’intelligenza artificiale di oggi si basa su modelli massicci e centralizzati con costi infrastrutturali in aumento, il CEO di Fortytwo Ivan Nikitin immagina un’alternativa scalabile e decentralizzata.
Attingendo dai suoi primi lavori nel settore dell'intelligenza artificiale, Nikitin ha visto in prima persona i limiti dell'intelligenza artificiale convenzionale, portando alla creazione di Fortytwo, un modello di intelligenza artificiale basato su sciami che sfrutta modelli piccoli e specializzati per maggiore efficienza, precisione ed efficienza dei costi.
In questa intervista esclusiva con BeInCrypto, Nikitin spiega perché l'intelligenza artificiale centralizzata è insostenibile, come l'approccio decentralizzato di Fortytwo supera i LLM monolitici e perché il suo lancio devnet sulla testnet di Monad segna una svolta per la scalabilità dell'intelligenza artificiale.
BeInCrypto: Cosa ti ha portato nel campo dell'intelligenza artificiale e in che modo il tuo viaggio ha plasmato la visione dietro Fortytwo?
Ivan Nikitin: Il mio viaggio nell'intelligenza artificiale è in realtà iniziato con lo sviluppo del gioco. Vedevo i giochi come il parco giochi perfetto per gli agenti IA che imparano da soli e quella ricerca dell'intelligenza in evoluzione è diventata la mia missione principale. Nel 2006, mentre studiavo alla DePaul University di Chicago, ho messo insieme uno studio di giochi indipendente con una forte attenzione alla ricerca sull'intelligenza artificiale.
Durante quel periodo ho incontrato Vlad, ora dottore di ricerca, che allora stava lavorando alla sua prima laurea. Insieme, abbiamo sviluppato la nostra prima tecnologia di gioco basata sull'intelligenza artificiale: un algoritmo di intelligenza in evoluzione ispirato a NEAT (NeuroEvolution of Augmenting Topologies). Il momento in cui l’abbiamo visto funzionare è stato fondamentale. Quasi un anno dopo, Google DeepMind ha pubblicato la ricerca Agent57, dimostrando come il loro approccio di Reinforcement Learning abbia superato i benchmark umani su 57 giochi Atari, qualcosa che avevamo già ottenuto con il nostro metodo. Quello è stato il momento in cui abbiamo capito di essere in vantaggio e il gioco era iniziato.
Più o meno nello stesso periodo sono emersi i primi modelli linguistici basati su Transformer, come BERT nel 2018. Ci siamo espansi oltre l'intelligenza artificiale del gioco, immergendoci nell'intelligenza artificiale conversazionale basata su LLM. Ma nonostante la forte domanda e le promettenti dimostrazioni tecnologiche, il ridimensionamento dell’intelligenza artificiale è rimasto un collo di bottiglia. Ancora oggi, i partner di alto livello di OpenAI devono affrontare limiti di utilizzo rigidi e i modelli di intelligenza artificiale ad alto carico auto-hosting sono proibitivi.
Quindi, la vera domanda è diventata: aspettiamo che le Big Tech costruiscano abbastanza data center da miliardi di dollari o ripensiamo alla scalabilità dell’intelligenza artificiale? È così che è nato Fortytwo: un protocollo AI decentralizzato progettato per rendere l'inferenza scalabile ed economicamente vantaggiosa una realtà per sviluppatori come noi.
BeInCrypto: Il settore dell'intelligenza artificiale è a un bivio, con modelli centralizzati che richiedono enormi quantità di calcolo e capitale. Fortytwo propone un approccio radicalmente diverso: cosa ti ha convinto che l’intelligenza artificiale decentralizzata sia il futuro e come cambia le regole del gioco?
Ivan Nikitin: Alcuni anni fa, la scarsità di elaborazione non era ampiamente riconosciuta al di fuori del settore. Stavano emergendo nuovi fornitori di inferenza, spingendo l’innovazione in tutto lo stack tecnologico. Ma poi sono arrivati segnali chiari: Sam Altman ha chiesto 5-7 trilioni di dollari in infrastrutture per l’intelligenza artificiale, l’Europa stima 1 trilione di dollari in ammodernamenti della rete elettrica per supportare la domanda di intelligenza artificiale e gli Stati Uniti hanno rimesso in servizio gli impianti nucleari. Tutto ciò accadeva mentre le vere e proprie applicazioni di intelligenza artificiale erano ancora nelle fasi iniziali.
Con l’aumento delle capacità dei modelli, l’intelligenza artificiale ha iniziato ad andare oltre le applicazioni di chat verso nuove aree come la codifica dei copiloti. Anche in questa nicchia, piattaforme come Cursor stanno già consumando più risorse di calcolo di quelle che Anthropic può fornire. I modelli di ragionamento richiedono ancora più inferenze per richiesta, aumentando ulteriormente i costi e rispettando i limiti API.
Allo stesso tempo, i dispositivi consumer stanno diventando più potenti, ma la maggior parte del loro calcolo rimane sottoutilizzata. I modelli locali offrono un’alternativa ma faticano a eguagliare le capacità di ragionamento dei modelli centralizzati più ampi. Invece di scegliere tra una costosa intelligenza artificiale proprietaria e modelli locali sottodimensionati, Fortytwo intraprende una strada diversa: collega i modelli eseguiti localmente in una rete globale peer-to-peer dove ragionano insieme.
Il passaggio all’intelligenza artificiale decentralizzata non riguarda solo l’efficienza, ma anche la fattibilità a lungo termine. L’infrastruttura IA centralizzata sta diventando una corsa agli armamenti insostenibile, che richiede investimenti esponenziali con rendimenti decrescenti. L’intelligenza artificiale richiede una base scalabile che si allinei con il progresso tecnologico, non contro di esso. Sfruttando l’elaborazione ampiamente disponibile anziché concentrarla in poche mani, possiamo garantire che l’intelligenza artificiale rimanga accessibile, adattabile e resiliente.
BeInCrypto: il modello di swarm intelligence di Fortytwo afferma di sovraperformare gli LLM monolitici su diversi benchmark chiave riducendo al contempo i costi. Sapreste spiegare in che modo una rete di piccoli modelli di intelligenza artificiale raggiunge questa efficienza senza compromettere la precisione?
Ivan Nikitin: La chiave dell'efficienza di Fortytwo sta nell'abbandonare l'idea che i modelli più grandi siano sempre migliori. Invece di fare affidamento su un unico, massiccio LLM, utilizziamo una rete di modelli più piccoli e specializzati che collaborano. Ciò non solo rende l’inferenza più economica, ma migliora anche la precisione nelle applicazioni del mondo reale.
I Small Language Models (SLM) superano costantemente i LLM generalisti in compiti specializzati come codifica, matematica, diritto e medicina. Invece di forzare un modello a gestire tutto, Fortytwo indirizza in modo intelligente le query a modelli ottimizzati per domini specifici. Questo da solo aumenta la precisione, ma l’inferenza dello sciame fa un ulteriore passo avanti.
Invece di fare affidamento su una singola risposta AI, Fortytwo distribuisce le attività su più nodi, classifica gli output e compila quelli più preziosi e affidabili nella risposta finale. La precisione non è solo un sottoprodotto: è integrata nel processo attraverso la convalida dinamica tra pari.
E poiché ciò avviene su una rete decentralizzata anziché all’interno di costosi data center, l’inferenza è notevolmente più efficiente, fino a 35 volte più economica di OpenAI o1. Man mano che sempre più nodi si uniscono, la rete si ridimensiona in modo organico, consentendo casi d'uso dell'intelligenza artificiale completamente nuovi che richiedono richieste API ad alto volume, che si tratti di codifica di nuova generazione e altri copiloti specializzati, agenti conversazionali nei giochi o integrazione di funzionalità LLM nei dispositivi IoT.
BeInCrypto: il tuo modello di business mira a sconvolgere il mercato dell'inferenza dell'intelligenza artificiale da oltre 25 miliardi di dollari. Quali vantaggi unici offre Fortytwo a sviluppatori, imprese e operatori di nodi rispetto ai tradizionali fornitori di intelligenza artificiale?
Ivan Nikitin: Per gli sviluppatori, Fortytwo offre l'inferenza AI senza i soliti vincoli: costi inferiori rispetto ai fornitori centralizzati, nessun limite di velocità API e capacità di ragionamento in continuo miglioramento. Man mano che la rete si espande e i modelli collaborano in modo più efficace, la sua capacità di gestire compiti complessi aumenterà, avvicinandosi a prestazioni di livello limite. Oltre all'efficienza, l'architettura senza autorizzazione di Fortytwo garantisce un approccio più equilibrato alle informazioni, libero dal controllo centralizzato su ciò a cui viene data priorità o filtrato.
Per gli operatori dei nodi, gestire un nodo Fortytwo va oltre il semplice contributo in termini di calcolo: è un'opportunità per partecipare alla costruzione di un'intelligenza su scala planetaria ottimizzando al contempo per compensi più elevati. A livello base, chiunque può arricchire la conoscenza del proprio nodo fornendogli privatamente PDF o altri documenti. Queste risorse rimangono locali e non vengono mai condivise con la rete, ma il modello può essere preso in considerazione durante il ragionamento e la generazione di inferenze. Gli utenti più avanzati, quelli con esperienza nell’apprendimento automatico e nella scienza dei dati, possono integrare ottimizzazioni personalizzate o modelli privati, aumentando significativamente il loro potenziale di guadagno. Fondamentalmente, questi modelli e perfezionamenti rimangono interamente di proprietà dell’operatore e non sono mai apertamente esposti alla rete.
BeInCrypto: Alcuni sostengono che l'AGI richiederà supercomputer centralizzati, ma Fortytwo prende una strada diversa. In che modo il vostro modello decentralizzato di swarm intelligence contribuisce all'evoluzione dell'AGI e quali sono le maggiori sfide future?
Ivan Nikitin: L’ipotesi che l’AGI abbia bisogno di un enorme supercomputer centralizzato deriva dall’idea che l’intelligenza si ottiene meglio con un unico modello onnicomprensivo. Ma l'intelligenza non riguarda solo la pura potenza di elaborazione: riguarda il modo in cui la conoscenza viene strutturata, condivisa e perfezionata. Fortytwo adotta un approccio diverso: invece di concentrare tutto in un unico sistema, consente a modelli di intelligenza artificiale con punti di forza diversi di lavorare insieme, creando un’intelligenza più adattabile e in evoluzione.
Ci piace pensare a Fortytwo come a “Wikipedia che può pensare”. Proprio come Wikipedia è gestita da contributori che perfezionano ed espandono argomenti specifici, Fortytwo cresce grazie ai contributi della sua comunità. Alcuni forniscono elaborazione, mentre altri possono sviluppare e mantenere modelli altamente specializzati. Ad esempio, un esperto di machine learning potrebbe mettere a punto un modello esclusivamente per la programmazione Rust, mantenendolo aggiornato con gli standard più recenti e i migliori set di dati. Ogni query relativa a Rust trae vantaggio da tale esperienza e il manutentore guadagna ricompense per aver migliorato la conoscenza collettiva della rete in quell'area.
Questo approccio collaborativo all’intelligenza artificiale consente alle capacità di emergere dinamicamente anziché essere predefinite da un’unica architettura. Invece di fare affidamento su un modello unico per tutti, la struttura di Fortytwo garantisce che l'intelligenza si espanda organicamente man mano che arrivano nuovi contributi. E poiché è decentralizzata, è scalabile senza limiti: ogni nuovo nodo apporta ulteriore conoscenza, elaborazione e auto-miglioramento alla rete.
Le maggiori sfide future riguardano il coordinamento di una rete globale di modelli, la garanzia di inferenza a bassa latenza per applicazioni in tempo reale e la navigazione nel panorama normativo dell’intelligenza artificiale decentralizzata. Ma l’idea centrale rimane: l’intelligenza non significa solo avere più potere: riguarda strutturare e distribuire la conoscenza in un modo che continui a migliorare nel tempo.
BeInCrypto: la tua devnet verrà lanciata sulla testnet di Monad come parte del programma "Hitchhiking to AGI". In che modo l'architettura blockchain di Monad migliora la scalabilità e l'esecuzione trustless della tua IA decentralizzata?
Ivan Nikitin: Quando abbiamo iniziato a lavorare su Fortytwo, non sapevamo subito su quale rete basarci. Dopotutto, come potremmo parlare di scalabilità dell’intelligenza artificiale se fossimo ostacolati dal throughput della rete?
Il throughput di 10.000 TPS di Monad e le tariffe basse hanno fornito il tipo di prestazioni necessarie per casi d'uso ad alta richiesta come il nostro. Sebbene i nodi di Fortytwo operino come una rete peer-to-peer, il coordinamento trustless non sarebbe possibile senza una blockchain ad alta velocità per registrare le prestazioni dei nodi e mantenere un sistema di reputazione storica incrementale.
Ciò è essenziale perché Fortytwo è progettato per una partecipazione aperta, senza convalida centralizzata o whitelist dei modelli di intelligenza artificiale. Monitoriamo i risultati della valutazione tra pari sulla catena per garantire l'integrità della rete senza introdurre latenza evidente. Monad consente questo livello di sicurezza ed efficienza, rendendolo una soluzione naturale per il nostro caso di scalabilità dell'intelligenza artificiale attraverso la decentralizzazione.
BeInCrypto: Una delle maggiori sfide dell'intelligenza artificiale oggi è l'affidabilità: allucinazioni, imprecisioni e pregiudizi. In che modo il modello di inferenza dello sciame decentralizzato di Fortytwo affronta questi problemi meglio delle alternative centralizzate?
Ivan Nikitin: Uno dei problemi fondamentali dell'intelligenza artificiale centralizzata è che si basa su un unico modello, il che significa che i suoi pregiudizi, imprecisioni e limitazioni sono incorporati. Se il modello sbaglia qualcosa, non esiste un modo integrato per effettuare un controllo incrociato del suo output. Fortytwo adotta un approccio diverso distribuendo l'inferenza su più modelli indipendenti e lasciando che si convalidino a vicenda.
Invece di fare affidamento su una singola risposta, Fortytwo classifica più risposte da diversi nodi e seleziona quella meglio convalidata. Questo processo di valutazione tra pari riduce naturalmente le allucinazioni e gli output errati garantendo che vengano utilizzate solo le risposte più affidabili.
Un altro vantaggio è la diversità dei modelli. Un modello centralizzato è bloccato nei suoi dati di addestramento, rendendolo soggetto a pregiudizi specifici. La rete di Fortytwo, d'altra parte, sfrutta una varietà di modelli perfezionati specializzati in diversi domini. Il risultato è un sistema più adattivo ed equilibrato che non è limitato dai punti ciechi di una singola IA.
Infine, la rete si auto-migliora nel tempo. Poiché i nodi vengono premiati in base alla precisione, i modelli che producono costantemente risposte di bassa qualità perdono influenza, mentre quelli con le migliori prestazioni diventano dominanti. Ciò crea un ciclo di feedback continuo in cui il sistema si ottimizza continuamente, qualcosa che l’intelligenza artificiale centralizzata fatica a raggiungere.
BeInCrypto: Guardando al futuro, che aspetto avrà il successo per Fortytwo? L’intelligenza artificiale decentralizzata diventerà la norma o vedete una coesistenza con modelli centralizzati?
Ivan Nikitin: Il successo significa dimostrare che l'intelligenza artificiale decentralizzata non è solo un'alternativa: è un modo migliore per ampliare l'intelligenza. Entro il 2030, ci aspettiamo un importante cambiamento verso un’intelligenza artificiale senza autorizzazione e guidata da sciami poiché sviluppatori, aziende e utenti riconoscono che fare affidamento su pochi fornitori centralizzati non è sostenibile. Le crescenti limitazioni dei modelli centralizzati spingeranno il settore in questa direzione e Fortytwo farà parte di questa trasformazione.
Al di là dell’adozione, il vero successo significa che l’infrastruttura AI è posseduta e governata dai suoi utenti. Invece di essere controllata da una manciata di aziende, l’intelligence dovrebbe essere modellata da coloro che contribuiscono, sia eseguendo l’elaborazione, migliorando i modelli o perfezionando competenze specifiche del settore. Il modello di Fortytwo consente una crescita organica, guidata dalla comunità, in cui l'intelligenza artificiale si evolve sulla base dei contributi del mondo reale.
I modelli centralizzati non scompariranno del tutto, ma diventeranno solo una parte di un ecosistema più ampio. Il vero cambiamento arriverà dall’intelligenza artificiale che si perfeziona continuamente, con milioni di nodi interconnessi che ragionano collettivamente su scala planetaria. È lì che vedo Quarantadue tra cinque anni: alimentare una rete di intelligence aperta e autosufficiente.
Da questa conversazione con Ivan Nikitin risulta evidente che l’intelligenza artificiale è a un punto di svolta. Scalabilità, costi e affidabilità stanno costringendo il settore a ripensare le sue fondamenta. Sia che l’intelligenza artificiale decentralizzata diventi il modello dominante o si evolva insieme ai sistemi centralizzati, il cambiamento è già in atto. Quarantadue ne è la prova, sfidando ipotesi radicate da tempo e dimostrando che l’intelligenza non ha bisogno di essere confinata in enormi data center per essere efficace.
Il post Domande e risposte esclusive: il CEO di Quarantadue Ivan Nikitin sul perché il futuro dell'intelligenza artificiale è decentralizzato è apparso per la prima volta su BeInCrypto .