As empresas de IA precisam pagar pelos dados de treinamento que alimentam seus sistemas generativos de IA? A questão é fortemente contestada no Vale do Silício e em uma onda de ações judiciais movidas contra gigantes da tecnologia como Meta, Google e OpenAI. Em Washington, DC, porém, parece haver um consenso crescente de que os gigantes da tecnologia precisam desembolsar.
Hoje, numa audiência no Senado sobre o impacto da IA no jornalismo, legisladores de ambos os lados concordaram que a OpenAI e outros deveriam pagar aos meios de comunicação pela utilização do seu trabalho em projectos de IA. “Não é apenas moralmente correto”, disse Richard Blumenthal, o democrata que preside o Subcomitê do Judiciário sobre Privacidade, Tecnologia e Direito que realizou a audiência. “É legalmente exigido.”
Josh Hawley, um republicano que trabalha com Blumenthal na legislação sobre IA, concordou. “Não deveria ser que só porque as maiores empresas do mundo querem devorar os seus dados, elas deveriam ser capazes de fazê-lo”, disse ele.
Os líderes da indústria de mídia presentes na audiência de hoje descreveram como as empresas de IA estavam colocando sua indústria em perigo ao usar seu trabalho sem remuneração. Curtis LeGeyt, CEO da National Association of Broadcasters, Danielle Coffey, CEO da News Media Alliance, e Roger Lynch, CEO da Condé Nast, falaram a favor do licenciamento obrigatório. (WIRED é propriedade da Condé Nast.)
Coffey afirmou que as empresas de IA “evisceram o conteúdo de qualidade do qual se alimentam”, e Lynch caracterizou os dados de treinamento coletados sem permissão como “bens roubados”. Coffey e Lynch também disseram acreditar que as empresas de IA estão infringindo os direitos autorais de acordo com a lei atual. Instaram os legisladores a esclarecer que a utilização de conteúdos jornalísticos sem primeiro intermediar acordos de licenciamento não é protegida pelo uso justo, uma doutrina jurídica que permite violações de direitos de autor sob certas condições.
Terreno Comum
As audiências no Senado podem ser contraditórias, mas o clima hoje foi amplamente agradável. Os legisladores e os membros da indústria da mídia muitas vezes aplaudiram as declarações uns dos outros. “Se o Congresso pudesse esclarecer que o uso do nosso conteúdo, ou de outro conteúdo de editor, para o treinamento e produção de modelos de IA não é uso justo, então o mercado livre cuidará do resto”, disse Lynch a certa altura. “Isso me parece eminentemente razoável”, respondeu Hawley.
O professor de jornalismo Jeff Jarvis foi a única voz discordante na audiência. Afirmou que a formação sobre dados obtidos sem pagamento é, de facto, uma utilização justa e manifestou-se contra o licenciamento compulsório, argumentando que prejudicaria o ecossistema de informação em vez de o salvaguardar. “Devo dizer que estou ofendido por ver os editores fazerem lobby por legislação protecionista, negociando com o capital político obtido através do jornalismo”, disse ele, atacando os seus colegas oradores. (Jarvis também foi sujeito à única linha de questionamento realmente controversa da audiência, da republicana Marsha Blackburn, que incitou Jarvis sobre se a IA é tendenciosa contra os conservadores e recitou um poema gerado pela IA elogiando o presidente Biden como prova.)
Fora da sala do comitê, há menos acordo sobre a necessidade de licenciamento obrigatório. A OpenAI e outras empresas de IA argumentaram que não é viável licenciar todos os dados de treinamento, e alguns especialistas independentes em IA concordam.