San Francisco: la class action contro NVIDIA Corp. e la sua IA

San Francisco: la class action contro NVIDIA Corp. e la sua IA

In California alcuni autori hanno recentemente presentato una proposta di class action per violazione del copyright contro la società NVIDIA e la sua IA generativa. In particolare, la società avrebbe utilizzato senza autorizzazione alcune opere per addestrare la sua intelligenza artificiale NeMo Megatron-GPT.

L’8 marzo 2024 è stata presentata avanti al Tribunale distrettuale federale di San Francisco una proposta di azione legale collettiva per violazione del copyright contro la società NVIDIA Coporation [1]. In particolare, la società leader mondiale nella produzione di processori grafici e chipset avrebbe utilizzato senza autorizzazione alcune opere protette da diritto d’autore nel proprio set di dati per addestrare l’intelligenza artificiale generativa NeMo Megatron-GPT, violando così lo US Copyright Act [2].La causa si riferisce in particolare ai modelli rilasciati da NVIDIA nel settembre 2023 NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B e NeMo Megatron-T5 3B, ospitati sul sito web gestito da Hugging Face [3], su cui sono state anche pubblicate le informazioni relative a ciascun set di dati di addestramento.

NVIDIA avrebbe in particolare utilizzato senza autorizzazione un’enorme quantità di testi, tra cui quelli degli autori Abdi Nazemian, Brian Keene e Stewart O’Nan, per addestrare la sua IA che, non essendo programmata in modo tradizionale, ma come Large Language Model (LLM), ha richiesto l’impiego di un’enorme quantità di opere testuali, pari a circa a 196.460. Tuttavia, non avendo alcuno degli autori mai autorizzato la società californiana a realizzare copie delle proprie opere, o a realizzare opere derivate, pubblicarle o distribuirle con licenza aperta, NVDIA sarebbe responsabile di violazione diretta del copyright secondo il titolo 17 U.S. Code §501 [4].

La causa in questione rappresenta in realtà solo uno dei numerosi contenziosi avviati da molti autori e testate giornalistiche contro le aziende che realizzano prodotti basati sull’intelligenza artificiale generativa, capace di creare contenuti sulla base di testi, immagini e suoni.

Secondo quanto argomentato dai ricorrenti, il fatto che NVIDIA abbia rimosso lo scorso ottobre i dati del set “a causa di una violazione di copyright” rappresenterebbe un’ammissione di colpevolezza da parte della stessa. Tuttavia, almeno per il momento, NVIDIA non ha ancora chiarito la propria posizione, né commentato l’accaduto.


Di Daniela Ghidelli
Avvocato iscritto all’Ordine degli Avvocati di Milano. Collabora con lo Studio Legale Associato ALLegal, dove si occupa prevalentemente di diritto societario, contrattualistica, privacy e nuove tecnologie. È relatrice in vari convegni in tema di privacy e intelligenza artificiale.


Note:
[1] Caso n. 3:24-cv-01454
[2] https://www.copyright.gov/title17/title17.pdf
[3] https://huggingface.co/
[4] US Code, Title 17, §501