DeAI: la soluzione Web3 ai problemi di copyright dell’intelligenza artificiale centralizzata

ChatGPT e Gemini di Google sono emersi come forze trainanti nella corsa per modelli linguistici di grandi dimensioni superiori. È evidente che queste piattaforme hanno trasformato il settore dell'intelligenza artificiale. Tuttavia, il modo in cui acquisiscono informazioni e gestiscono i set di dati è stata una continua preoccupazione etica.

BeInCrypto ha parlato con progetti emergenti di intelligenza artificiale in Web3, tra cui ChainGPT, Space ID, Sapien.io, Vanar Chain, O.XYZ, AR.IO e Kindred, per discutere le preoccupazioni contemporanee dei diritti di proprietà intellettuale, copyright e proprietà. Un aspetto fondamentale è stato il potenziale dell’intelligenza artificiale decentralizzata (deAI) come valida alternativa.

L'ascesa dei LLM e il dilemma dell'acquisizione dei dati

Dalla loro creazione, i modelli linguistici di grandi dimensioni (LLM) hanno rapidamente guadagnato un uso diffuso. In molti modi, piattaforme come ChatGPT di OpenAI e Gemini di Google sono state il primo vero contatto del pubblico con le capacità dell'intelligenza artificiale (AI) e il loro potenziale di utilizzo non esaustivo.

Tuttavia, queste società sono state anche messe sotto esame per le loro operazioni. Per rimanere competitivi, i modelli di intelligenza artificiale necessitano dell’accesso a un gran numero di set di dati. Gli LLM possono solo generare risposte simili a quelle umane e comprendere query complesse elaborando enormi quantità di testo.

Per far sì che ciò accada, i principali giganti della tecnologia come OpenAI, Google, Meta, Microsoft, Anthropic e Nvidia incanalano in gran parte tutti i dati e le informazioni disponibili su Internet per addestrare i loro modelli di intelligenza artificiale. Questo approccio ha sollevato seri interrogativi su chi possiede l’input che queste piattaforme ingeriscono e successivamente rigurgitano sotto forma di output.

Nonostante il potenziale dirompente dell’intelligenza artificiale, le preoccupazioni sui diritti di proprietà intellettuale sono sfociate in battaglie legali molto controverse.

Le aziende di intelligenza artificiale stanno costruendo imperi sui contenuti rubati?

La rapida adozione dell’intelligenza artificiale ha sollevato preoccupazioni relative alla proprietà dei dati, alla privacy e alla potenziale violazione del copyright . Un punto chiave del conflitto è l’utilizzo di materiale protetto da copyright per addestrare modelli di intelligenza artificiale centralizzati controllati esclusivamente dalle grandi aziende.

"Le aziende di intelligenza artificiale stanno costruendo imperi sulle spalle dei creatori senza chiedere il permesso o condividere il bottino. Autori, artisti e musicisti hanno trascorso anni a perfezionare la loro arte, solo per scoprire che il loro lavoro viene assorbito da modelli di intelligenza artificiale che generano versioni knockoff in pochi secondi", ha detto a BeInCrypto Jawad Ashraf, CEO di Vanar Chain.

Questo problema ha effettivamente causato un’insoddisfazione diffusa. Il CEO di Vanar Chain ha aggiunto che OpenAI e altri hanno ammesso apertamente di aver sottratto materiale protetto da copyright, innescando azioni legali e una più ampia resa dei conti sull'etica dei dati.

"Il nocciolo della questione è il risarcimento: le aziende di intelligenza artificiale sostengono che lo scraping dei dati disponibili al pubblico è un gioco leale, mentre i creatori lo vedono come un furto alla luce del sole", afferma Ashraf.

Definire i confini del lavoro generato dall’intelligenza artificiale

Il New York Times ha intentato una causa contro OpenAI e Microsoft nel dicembre 2023, presunte violazioni del copyright e uso non autorizzato della sua proprietà intellettuale.

Il Times ha accusato Microsoft e OpenAI di creare un modello di business basato sulla " copia e utilizzo illegali delle opere di valore unico del Times ". Il giornale sostiene inoltre che questi modelli “ sfruttano e, in molti casi, conservano ampie porzioni dell’espressione protetta da copyright contenuta in tali opere ”.

Quattro mesi dopo, altri otto editori di notizie operanti in sei diversi stati degli Stati Uniti hanno citato in giudizio Microsoft e OpenAI per violazione del copyright.

Il Chicago Tribune, il Denver Post, il Mercury News in California, il New York Daily News, l’Orange County Register in California, l’Orlando Sentinel, la Pioneer Press del Minnesota e il Sun Sentinel in Florida – hanno tutti affermato che le due società tecnologiche hanno utilizzato i loro articoli senza autorizzazione nei prodotti di intelligenza artificiale e hanno attribuito loro informazioni errate.

"I tribunali sono ora costretti a rispondere a domande che non esistevano fino a qualche anno fa: i contenuti generati dall'intelligenza artificiale costituiscono un lavoro derivato? I detentori del copyright possono richiedere un risarcimento quando i loro dati vengono utilizzati senza consenso?", Ha detto a BeInCrypto Trevor Koverko, co-fondatore di Sapien.io.

Oltre alle organizzazioni giornalistiche, editori, autori, musicisti e altri creatori di contenuti hanno avviato azioni legali contro queste società tecnologiche per informazioni protette da copyright.

Battaglie legali in tutti i settori

Proprio la scorsa settimana, tre gruppi commerciali hanno annunciato che faranno causa a Meta in un tribunale di Parigi, accusando Meta di “ utilizzare massicciamente opere protette da copyright senza autorizzazione ” per addestrare i suoi assistenti chatbot generativi basati sull’intelligenza artificiale, utilizzati su Facebook, Instagram e WhatsApp.

Nel frattempo, gli artisti visivi Sarah Andersen, Kelly McKernan e Karla Ortiz hanno citato in giudizio i generatori di arte AI Stability AI, DeviantArt e Midjourney per aver utilizzato il loro lavoro per addestrare i loro modelli di intelligenza artificiale .

"Non c'è fine alle preoccupazioni quando si tratta dell'uso non regolamentato di dati e materiale creativo da parte di società centralizzate di intelligenza artificiale. Attualmente, qualsiasi artista, autore o musicista con materiale disponibile al pubblico può far scansionare il proprio lavoro da algoritmi di intelligenza artificiale che imparano a creare contenuti quasi identici e trarne profitto mentre l'artista non ottiene nulla", ha affermato Phil Mataras, fondatore di AR.IO.

OpenAI e Google sostengono in particolare che se la legislazione limitasse il loro accesso al materiale protetto da copyright, gli Stati Uniti perderebbero la corsa all’intelligenza artificiale contro la Cina. Secondo loro, le aziende in Cina operano con minori vincoli normativi, offrendo ai loro rivali un vantaggio chiave.

Queste potenze stanno esercitando pressioni aggressive sul governo degli Stati Uniti affinché classifichi la formazione sull’intelligenza artificiale sui dati protetti da copyright come “fair use”. Sostengono che l'elaborazione da parte dell'intelligenza artificiale di contenuti protetti da copyright si traduce in nuovi risultati fondamentalmente diversi dal materiale originale.

Tuttavia, poiché gli strumenti di intelligenza artificiale generativa producono sempre più testo, immagini e voci, molte industrie stanno portando avanti azioni legali contro queste società.

"I creatori di contenuti, siano essi autori, musicisti o sviluppatori di software, spesso affermano che la loro [proprietà intellettuale] viene utilizzata in modi che vanno oltre il fair use, soprattutto quando i sistemi di intelligenza artificiale copiano o replicano aspetti del loro lavoro originale", ha affermato Ahmad Shadid, fondatore e CEO di O.XYZ.

Nel frattempo, in Web3, gli attori stanno facendo pressioni per un'alternativa all'approccio tradizionale delle aziende allo sviluppo LLM.

Le superfici DeAI come alternativa al Web3

L’intelligenza artificiale decentralizzata (deAI) è un campo emergente nel Web3 che esplora l’utilizzo della blockchain e della tecnologia di registro distribuito per creare sistemi di intelligenza artificiale più democratici e trasparenti.

"DeAI, sfruttando la blockchain e la tecnologia dei registri distribuiti, mira ad affrontare le preoccupazioni sulla proprietà dei dati e sul copyright creando sistemi di intelligenza artificiale più trasparenti. Distribuisce lo sviluppo e il controllo dei modelli di intelligenza artificiale su una rete globale, stabilendo modelli più equi per la formazione sull'intelligenza artificiale che rispettano i diritti dei creatori di contenuti. DeAI mira anche a fornire meccanismi per un compenso equo ai creatori il cui lavoro viene utilizzato nella formazione sull'intelligenza artificiale, risolvendo potenzialmente molti dei problemi associati ai modelli di intelligenza artificiale centralizzati", ha spiegato Max Giammario, CEO e fondatore di Kindred.

Con la crescente importanza globale dell’intelligenza artificiale, la sua fusione con la blockchain promette di trasformare entrambi i settori, creando nuove strade per l’innovazione e gli investimenti nel settore cripto.

In risposta, i costruttori del settore hanno già iniziato a sviluppare progetti di successo che uniscono le tecnologie AI e Web3.

Le migliori prestazioni delle monete crittografiche AI. — Le migliori criptovalute AI per capitalizzazione di mercato. Fonte: CoinGecko

A differenza del caso delle aziende che producono modelli di intelligenza artificiale centralizzati, deAI mira ad essere completamente open source .

OpenAI ha precedentemente sostenuto di essere conforme alla dottrina statunitense del fair use nonostante utilizzi materiale protetto da copyright per addestrare i suoi modelli di intelligenza artificiale. Inoltre, ChatGPT, la sua applicazione più popolare, è completamente gratuita.

Harrison Seletsky, Direttore dello sviluppo aziendale di Space ID, ha evidenziato una contraddizione nell'argomentazione di OpenAI.

"Il chiaro problema etico è che i materiali vengono utilizzati senza il permesso esplicito dei loro creatori. Se sono protetti da copyright, è necessario concedere il permesso e in genere pagare una tariffa. Ma oltre a ciò, anche se gli LLM come ChatGPT utilizzano dati open source, i modelli di OpenAI non sono open source. Fanno uso di materiale disponibile al pubblico senza "restituire" completamente le fonti da cui attingono.
C'è una domanda generale qui sul fatto se l'intelligenza artificiale debba essere open source. Il ChatGPT di OpenAI non lo è, mentre modelli come DeepSeek cinese lo sono, così come l'intelligenza artificiale decentralizzata. Dal punto di vista dell’etica e dei diritti di proprietà intellettuale, quest’ultima è sicuramente la scelta migliore”, ha affermato Seletsky.

Il controllo centralizzato di queste potenze tecnologiche solleva anche altre preoccupazioni riguardanti l’implementazione e la supervisione dei modelli di intelligenza artificiale.

Centralizzato e decentralizzato: differenze etiche e operative

In contrasto con la natura guidata dalla comunità della deAI, i modelli di IA centralizzati sono costruiti da un numero limitato di persone , il che porta a potenziali pregiudizi.

"L'intelligenza artificiale centralizzata di solito opera sotto un unico ombrello aziendale, dove le decisioni sono guidate da un motivo di profitto dall'alto verso il basso. È essenzialmente una scatola nera posseduta e gestita da un'entità. Al contrario, DeAI si basa su un approccio guidato dalla comunità. L'intelligenza artificiale è progettata per analizzare il feedback della comunità e ottimizzare per interessi collettivi anziché solo per quelli aziendali", ha spiegato Ahmad Shadid, fondatore e CEO di O.XYZ.

Nel frattempo, la tecnologia blockchain fornisce un percorso chiaro per la monetizzazione.

"I creatori possono tokenizzare le loro risorse creative – come articoli, musica o persino idee – e fissare i propri prezzi. Ciò crea un ambiente più equo sia per i creatori che per gli utenti della proprietà intellettuale, formando essenzialmente un mercato libero per la proprietà intellettuale. Inoltre rende la proprietà facile da dimostrare, poiché tutto sulla blockchain è trasparente e immutabile, rendendo molto più difficile per gli altri sfruttare il lavoro di qualcuno senza allineare adeguatamente gli incentivi", ha detto Seletsky a BeInCrypto.

Diversi costruttori Web3 hanno già sviluppato progetti che decentralizzano i contenuti utilizzati per l’intelligenza artificiale generativa. Piattaforme come Story, Inflectiv e Arweave sfruttano vari aspetti della tecnologia blockchain per garantire che i set di dati utilizzati per i modelli di intelligenza artificiale siano curati eticamente.

Ilan Rakhmanov, fondatore di ChainGPT, vede deAI come una forza contraria vitale all'IA centralizzata. Afferma che affrontare le pratiche non etiche dei monopoli esistenti sull’intelligenza artificiale sarà essenziale per coltivare un’industria più sana in futuro.

"Ciò costituisce un pericoloso precedente in cui le società di intelligenza artificiale possono utilizzare liberamente contenuti protetti da copyright senza un'adeguata attribuzione o pagamento. Dal punto di vista legale, ciò invita al controllo normativo, priva i creatori del controllo. ChainGPT crede nell'attribuzione e nella monetizzazione on-chain, garantendo uno scambio di valore equo tra utenti di intelligenza artificiale, contributori e formatori di modelli", ha affermato Rakhmanov.

Ma affinché la DeAI possa assumere un ruolo centrale, deve prima superare diversi ostacoli.

Quali ostacoli deve affrontare deAI?

Sebbene deAI abbia un potenziale in espansione , è anche nella sua fase nascente. Sotto questo aspetto, aziende come OpenAI e Google hanno il sopravvento per quanto riguarda l’abilità economica e le infrastrutture. Hanno i mezzi per gestire le vaste risorse necessarie per acquisire quantità così grandi di dati.

"Le società di intelligenza artificiale centralizzate hanno accesso a un'enorme potenza di calcolo, mentre deAI ha bisogno di reti efficienti e distribuite per scalare. Poi ci sono i dati: i modelli centralizzati prosperano su set di dati accumulati, mentre deAI deve costruire pipeline affidabili per l'approvvigionamento, la verifica e il compenso equo dei contributori", ha detto Koverko a BeInCrypto.

A quel punto, Ahmad Shadid ha aggiunto:

"Costruire e gestire sistemi di intelligenza artificiale su registri distribuiti può essere complicato, soprattutto se si tenta di gestire enormi quantità di dati su larga scala. Richiede anche un'attenta supervisione per mantenere i processi di apprendimento dell'intelligenza artificiale allineati con l'etica e gli obiettivi della comunità."

Queste potenze tecnologiche possono anche utilizzare le loro risorse e connessioni per esercitare forti pressioni contro concorrenti come deAI.

“Potrebbero farlo sostenendo regolamentazioni che favoriscano modelli centralizzati, sfruttando la loro posizione dominante sul mercato per limitare la concorrenza o controllando le risorse chiave necessarie per lo sviluppo dell’intelligenza artificiale”, ha affermato Giammario.

Per Ashraf, la probabilità che ciò accada dovrebbe essere data per scontata.

“Quando l’intero modello di business è costruito sull’accumulo di dati e sulla loro monetizzazione in segreto, l’ultima cosa che vuoi è un’alternativa aperta e trasparente. Aspettarti che i giganti dell’intelligenza artificiale facciano pressioni contro la DeAI, spingano per normative restrittive e utilizzino le loro vaste risorse per screditare le alternative decentralizzate. Ma Internet stesso è iniziato come un sistema decentralizzato prima che le aziende prendessero il sopravvento, e le persone si stanno rendendo conto degli aspetti negativi del controllo centralizzato di Vanar Chain previsto.

Tuttavia, per portare avanti la sua missione, deAI deve aumentare la propria consapevolezza pubblica, raggiungendo sia gli utenti Web3 che quelli esterni allo spazio.

Colmare il divario di conoscenza

Alla domanda sui principali ostacoli che deAI deve attualmente affrontare, Seletsky di Space ID ha affermato che le persone devono essere consapevoli del problema della violazione del copyright nei modelli di intelligenza artificiale per risolverlo.

"L'ostacolo principale è la mancanza di istruzione. La maggior parte degli utenti non sa da dove provengono i dati, come vengono analizzati e chi li controlla. Molti non si rendono nemmeno conto che l'intelligenza artificiale ha dei pregiudizi, proprio come gli esseri umani. È necessario istruire la persona media su questo prima che possa comprendere i vantaggi dei modelli di intelligenza artificiale decentralizzata", ha affermato.

Una volta che il pubblico avrà compreso le questioni legate al diritto d’autore all’interno dei modelli di intelligenza artificiale centralizzata, i sostenitori di deAI dovranno dimostrare attivamente i meriti di deAI come una forte alternativa. Tuttavia, nonostante la maggiore consapevolezza, deAI deve ancora affrontare sfide in termini di adozione.

“L’adozione è un’altra sfida. Le imprese sono abituate a soluzioni AI chiavi in mano e deAI deve soddisfare questo livello di accessibilità dimostrando al tempo stesso i suoi vantaggi in termini di sicurezza, trasparenza e innovazione”, ha affermato Koverko.

Il percorso da seguire: chiarezza normativa e fiducia pubblica

Una volta affrontate le sfide dell’istruzione e dell’accessibilità, il percorso verso una più ampia adozione della deAI dipende dalla chiarezza normativa e dalla costruzione della fiducia del pubblico. Trevor Koverko, co-fondatore di Sapien.io, ha anche aggiunto che deAI ha bisogno di chiarezza normativa per raggiungere questi obiettivi.

“Senza quadri chiari, i progetti deAI rischiano di essere messi da parte dall’incertezza giuridica mentre gli attori centralizzati spingono per politiche a vantaggio del loro dominio. Superare queste sfide significa perfezionare la nostra tecnologia, dimostrare valore nel mondo reale e costruire un movimento che spinge per un’intelligenza artificiale aperta e democratizzata”, ha affermato.

Shadid concorda con la necessità di un maggiore sostegno istituzionale, aggiungendo che esso dovrebbe essere accompagnato dalla costruzione di una maggiore fiducia pubblica.

“La trasparenza può essere inquietante se si impiegano decenni a perfezionare metodi proprietari, quindi DeAI deve dimostrare la sua superiorità in termini di fiducia e innovazione. Un altro ostacolo è creare sufficiente fiducia da parte degli utenti e chiarezza normativa in modo che le persone – e anche i governi – si sentano a proprio agio con il modo in cui vengono gestiti i dati. giusto”, ha spiegato Ahmad Shadid.

In definitiva, le preoccupazioni sul copyright che circondano i modelli di intelligenza artificiale richiedono un cambio di paradigma, concentrandosi sul rispetto della proprietà intellettuale e sulla promozione di un ecosistema di intelligenza artificiale più democratico, indipendentemente dall’impatto finale di deAI.

Il post DeAI: la soluzione Web3 alle preoccupazioni sul copyright dell'intelligenza artificiale centralizzata è apparso per la prima volta su BeInCrypto .