Una fondazione olandese rimuove un set di dati di addestramento sull’intelligenza artificiale utilizzato illegalmente

Citando la violazione del copyright, l’organizzazione olandese BREIN è riuscita a rimuovere un ampio set di dati linguistici che veniva utilizzato nella formazione sull’intelligenza artificiale.

In una dichiarazione rilasciata martedì, BREIN ha spiegato che il set di dati comprendeva 10.000 libri, articoli di notizie e sottotitoli in lingua olandese per film e serie TV ottenuti senza autorizzazione.

La legge sull'intelligenza artificiale dell'UE mira a regolamentare le fonti di dati sulla formazione

Secondo il direttore Bastiaan van Ramshorst, non è stato immediatamente chiaro quanto il set di dati avrebbe potuto essere utilizzato dalle aziende di intelligenza artificiale. "È molto difficile saperlo, ma stiamo cercando di essere puntuali" per evitare future cause legali, ha detto.

La legge sull’intelligenza artificiale recentemente proposta dall’Unione europea richiederà inoltre alle società di intelligenza artificiale di fornire l’accesso al proprio set di dati e alla fonte dei dati utilizzati per addestrare i modelli di intelligenza artificiale. Altre battaglie legali correlate sono ancora in corso negli Stati Uniti. Ad esempio, OpenAI, sostenuta da Microsoft, viene regolarmente coinvolta in varie questioni legali, come quella recente con il New York Times.

Si dice che Microsoft abbia copiato le opere giornalistiche registrate del querelante oltre ad altre opere giornalistiche protette da copyright. Riguardo alla potenziale violazione, l'amministratore delegato della società avrebbe affermato che la società dispone di questi dati.

Le accuse suggeriscono che Microsoft abbia utilizzato questi materiali protetti da copyright nei prodotti AI, inclusi ChatGPT e Copilot, senza ottenere le licenze. La denuncia accusa specificamente Microsoft di aver rimosso informazioni significative da questi lavori. Come il nome dell'autore, il titolo dell'opera, la filigrana "copyright" e altre restrizioni.

In Danimarca le misure antipirateria hanno prodotto risultati sostanziali anche nella lotta contro la violazione del diritto d’autore. L’anno scorso, un gruppo di protezione del copyright con sede in Danimarca, la Denmark Rights Alliance, ha chiesto e ottenuto che il set di dati “Books3” fosse rimosso da Internet.

Il fornitore del set di dati rispetta l'ordinanza del tribunale e rimuove i contenuti

La persona che ha fornito il set di dati olandese ha aderito all'ordinanza del tribunale emessa da BREIN. Questo accordo ha comportato la rimozione del set di dati dal sito Web che in precedenza forniva il set di dati per il download. BREIN ha rifiutato di rivelare l'identità della persona coinvolta in questo caso a causa delle leggi olandesi sulla privacy.

La rimozione di questo set di dati dimostra che i gruppi di tutela del diritto d’autore continuano a lottare per la protezione dei diritti di proprietà intellettuale nel mondo digitale. Per affrontare il problema dello scraping di massa di materiali protetti da copyright, BREIN raccomanda ai titolari dei diritti di utilizzare le riserve previste dal Copyright Act (articolo 15o.1).

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto