Os processos judiciais nunca são exatamente uma festa de amor, mas a luta pelos direitos autorais entre o The New York Times e a OpenAI e a Microsoft está se tornando especialmente controversa. Esta semana, o Times alegou que os engenheiros da OpenAI apagaram inadvertidamente dados que a equipe do jornal passou mais de 150 horas extraindo como evidências potenciais.
A OpenAI conseguiu recuperar grande parte dos dados, mas a equipe jurídica do Times diz que ainda faltam os nomes dos arquivos originais e a estrutura das pastas. De acordo com um declaração apresentado ao tribunal na quarta-feira por Jennifer B. Maisel, advogada do jornal, isso significa que as informações “não podem ser usadas para determinar onde os artigos copiados dos autores das notícias” podem ter sido incorporados aos modelos de inteligência artificial da OpenAI.
“Discordamos das caracterizações feitas e apresentaremos nossa resposta em breve”, disse o porta-voz da OpenAI, Jason Deutrom, à WIRED em um comunicado. O New York Times não quis comentar.
O Times abriu um processo de direitos autorais contra a OpenAI e a Microsoft no ano passado, alegando que as empresas usaram ilegalmente seus artigos para treinar ferramentas de inteligência artificial como o ChatGPT. O caso é uma das muitas batalhas legais em andamento entre empresas de IA e editores, incluindo uma ação semelhante movida pelo Daily News sendo tratada por alguns dos mesmos advogados.
O caso do Times está atualmente em fase de descoberta, o que significa que ambos os lados estão entregando documentos e informações solicitados que poderiam se tornar provas. Como parte do processo, o tribunal exigiu que a OpenAI mostrasse ao Times os seus dados de treino, o que é um grande problema – a OpenAI nunca revelou publicamente exatamente que informações foram utilizadas para construir os seus modelos de IA. Para divulgá-lo, a OpenAI criou o que o tribunal chama de “sandbox” de duas “máquinas virtuais” que os advogados do Times poderiam examinar. Em sua declaração, Maisel disse que os engenheiros da OpenAI “apagaram” os dados organizados pela equipe do Times em uma dessas máquinas.
De acordo com o documento de Maisel, a OpenAI reconheceu que as informações foram excluídas e tentou resolver o problema logo após ter sido alertada no início deste mês. Mas quando os advogados do jornal analisaram os dados “restaurados”, eles estavam muito desorganizados, forçando-os “a recriar seu trabalho do zero, usando horas humanas e tempo de processamento de computador significativos”, disseram vários outros advogados do Times em uma carta apresentado ao juiz no mesmo dia da declaração de Maisel.
Os advogados observaram que “não tinham motivos para acreditar” que a exclusão foi “intencional”. Em e-mails enviados como exposição junto com a carta de Maisel, o conselheiro da OpenAI, Tom Gorman referido ao apagamento de dados como uma “falha”.