Google può spingere affinché lo scraping dell’IA sia considerato “fair use”?

Google vuole nuove leggi sul copyright che consentano ai sistemi di intelligenza artificiale di raschiare e utilizzare liberamente i contenuti online senza autorizzazione. Ma questa controversa proposta deve affrontare grandi barriere legali e rischia di minare le industrie creative una volta che sarà consentito lo scraping dell'IA.

Cosa vuole Google

In una recente dichiarazione al governo australiano, Google ha sostenuto che i sistemi di copyright "consentono un uso appropriato ed equo dei contenuti protetti da copyright per consentire la formazione di modelli di intelligenza artificiale". Ciò consentirebbe a Google di importare libri, articoli di notizie, immagini e altro per addestrare robot di intelligenza artificiale come Bard senza chiedere il consenso dei creatori.

Google probabilmente vuole regole identiche adottate a livello globale. La proposta afferma che consentirebbe comunque "opt-out realizzabili" per le entità che preferiscono che i loro dati non vengano utilizzati. Ma rendere lo scraping un diritto automatico che deve essere bloccato manualmente dopo il fatto rappresenta un cambiamento importante.

Lo scraping è già legale?

Alcuni esperti legali sostengono che la formazione sull'IA costituisce oggi un "fair use", il che significa che non è necessaria alcuna modifica della legge. Le dottrine del fair use consentono un uso limitato di materiale protetto da copyright per scopi come ricerca o commento senza autorizzazione.

Tuttavia, numerose cause legali contro Google e OpenAI sostengono che lo scraping per la formazione sull'IA viola i diritti dei creatori. Il fair use dipende da fattori quali:

– Se l'uso è trasformativo o competitivo

– Quantità di lavoro copiato

– Impatto sul mercato dell'originale

Le principali aree di controversia includono

Copia diretta

L'esperienza di ricerca SGE di Google copia le frasi alla lettera dai siti. Questo replica fedelmente l'espressione originale.

Danno di mercato

La promozione di contenuti AI rispetto alle fonti originali minaccia il traffico e le entrate dei creatori.

Rischi legali

La raschiatura di dati fattuali probabilmente ha una copertura più corretta rispetto all'acquisizione di lavori creativi. La copia di stili di scrittura e dettagli dei personaggi presenta alti rischi di violazione.

Per ora, se lo scraping sistematico dell'IA costituisca un uso corretto rimane giuridicamente ambiguo. La proposta di codificarlo come tale anticipa anni di contenziosi pendenti.

Cosa dovrebbe cambiare?

La legge sul copyright dà ai creatori il controllo sulle riproduzioni e sui derivati ​​del loro lavoro. Rendere legale la formazione AI per impostazione predefinita capovolgerebbe questo sistema optato.

Invece di imporre ai creatori l'onere di prevenire attivamente gli usi non autorizzati, gli utenti avrebbero bisogno di un'autorizzazione anticipata. Questo approccio "opt-in" rispetta il consenso dei creatori e fornisce loro un vantaggio nelle negoziazioni.

Un regime di opt-out trasferisce la leva finanziaria a società tecnologiche con tasche profonde. Senza consenso affermativo, possono rivendicare ampi diritti mentre i creatori si affrettano a vietarne l'uso.

Fair use significa solo citare le fonti?

Google suggerisce di identificare chiaramente le fonti di dati di addestramento per rendere equo lo scraping. Ma gli obblighi legali e morali relativi al diritto d'autore differiscono.

Citare passaggi plagiati non rende lecita la riproduzione. Anche le citazioni dettagliate non costituiscono un'attribuzione creativa sufficiente. Le citazioni richiedono sia l'attribuzione in linea che collegamenti specifici.

Anche con le citazioni, il testo generato dall'intelligenza artificiale in competizione per l'attenzione del lettore insieme al materiale "fonte" probabilmente danneggia ancora i creatori dal punto di vista commerciale.

Cosa sta guidando questo?

Google ha chiari incentivi finanziari per garantire l'accesso gratuito ai dati di formazione. Ma incombono crescenti minacce legali.

La copia parola per parola in prodotti come SGE rende Google vulnerabile alle azioni legali per copyright. Anche la generazione di storie con personaggi protetti da copyright rischia di essere denunciata per violazione.

Garantire diritti legali espliciti per lo scraping dei dati proteggerebbe efficacemente le capacità di intelligenza artificiale di Google dalle controversie. Ma questo andrebbe a scapito dei diritti dei creatori.

Prima di prendere in considerazione tali cambiamenti, i governi dovrebbero valutare attentamente gli impatti sia sull'innovazione che sulle industrie artistiche. Man mano che le capacità dell'IA crescono, è necessaria una via equilibrata che rispetti tutte le parti interessate.

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto