Home Tecnologia Meta acusada de treinar sua IA usando conteúdo pirata de torrents

Meta acusada de treinar sua IA usando conteúdo pirata de torrents

Por Humberto Marchezini


Um novo dia, uma nova polêmica em torno da inteligência artificial. Desta vez, a Meta foi acusada de usar conteúdo pirata de torrents para treinar seu modelo de linguagem grande (LLM) Llama, que alimenta a Meta AI. O caso foi um dos primeiros processos de direitos autorais movidos contra uma empresa de tecnologia por treinar IA.

Documentos revelam que Meta AI foi treinada com conteúdo pirata

Conforme relatado por Com fioMeta foi processada em 2023 por supostamente treinar Llama, o LLM da empresa, com conteúdo pirata. O caso ficou conhecido como “Kadrey et al. v. Meta Platforms” e foi arquivado pelos romancistas Richard Kadrey e Christopher Golden, que alegaram que Meta usou conteúdo protegido por direitos autorais sem autorização.

Até agora, Meta havia entregue documentos com informações editadas ao tribunal, mas o juiz Vince Chhabria, do Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia, ordenou que os documentos originais fossem tornados públicos – e foi o que aconteceu.

Os documentos revelam conversas entre funcionários da Meta sobre Meta AI e Llama. Em uma das conversas, um engenheiro diz que “não parece certo fazer torrent de um laptop corporativo (de propriedade da Meta), o que corrobora que a empresa usou conteúdo pirata para treinar sua IA. Outra conversa sugere que “MZ” (Mark Zuckeberg) autorizou o uso de material pirata.

As evidências sugerem que o Meta usou conteúdo da LibGen, uma enorme biblioteca de livros, revistas e artigos acadêmicos pirateados. A LibGen foi criada na Rússia em 2008 e tem sido alvo de vários processos judiciais de direitos de autor desde então, embora ninguém saiba quem realmente opera o “centro de pirataria”. Meta também supostamente usou conteúdo de outras “bibliotecas sombra” para treinamento de IA.

A empresa argumenta que utilizou materiais públicos sob a doutrina legal de “uso justo”, que permite o uso de conteúdo protegido por direitos autorais sem permissão em determinadas circunstâncias, que são analisadas caso a caso. Meta também afirma que está apenas “usando texto para modelar estatisticamente a linguagem e gerar expressões originais”.

E quanto à inteligência da Apple?

A maioria dos proprietários de iPhone vê pouco ou nenhum valor na inteligência da Apple até agora | Ícones de IA vistos no Mac, iPad e iPhone

Esta não é a primeira vez que grandes tecnologias são acusadas de treinar modelos de IA com conteúdo protegido por direitos autorais. No ano passado, uma investigação revelou que o modelo OpenELM criado pela Apple incluía legendas de mais de 170 mil vídeos do YouTube.

Embora a princípio isso tenha levado as pessoas a acreditar que a Apple estava usando conteúdo protegido por direitos autorais para treinar o Apple Intelligence, a empresa explicou mais tarde que o OpenELM era um modelo de código aberto criado para fins de pesquisa e que seu banco de dados não é usado para alimentar o Apple Intelligence.

De acordo com a Apple, seus recursos de IA disponíveis no iOS e macOS são treinados “em dados licenciados, incluindo dados selecionados para aprimorar recursos específicos, bem como dados disponíveis publicamente coletados por nosso rastreador da web”.

Vale a pena notar que muitas grandes editoras, como O jornal New York Times e O Atlântico optaram por não compartilhar seu conteúdo com o treinamento Apple Intelligence.

FTC: Usamos links de afiliados automotivos para geração de renda. Mais.



Source link

Related Articles

Deixe um comentário