Nos últimos meses, Morten Blichfeldt Andersen passou muitas horas vasculhando a GPT Store da OpenAI. Desde que foi lançado em janeiro, o mercado de bots personalizados foi preenchido com um amplo banco de ferramentas de IA úteis e às vezes peculiares. Geradores de desenhos animados giram Nova iorquino– ilustrações de estilo e fotos vívidas de anime. Assistentes de programação e redação oferecem atalhos para a elaboração de código e prosa. Há também um bot de análise de coresa identificador de aranhae um treinador de namoro chamado RizzGPT. No entanto, Blichfeldt Andersen está à procura apenas de um tipo muito específico de bot: aqueles criados com base nos livros protegidos por direitos autorais de seu empregador, sem permissão.
Blichfeldt Andersen é diretor editorial da Praxis, uma fornecedora dinamarquesa de livros didáticos. A empresa tem abraçado a IA e criou a sua própria chatbots personalizados. Mas atualmente está envolvido em um jogo de pancada na toupeira na Loja GPT, e Blichfeldt Andersen é o homem que segura o martelo.
“Tenho procurado pessoalmente infrações e as reportado”, diz Blichfeldt Andersen. “Eles continuam aparecendo.” Ele suspeita que os culpados sejam principalmente jovens que carregam material de livros didáticos para criar bots personalizados para compartilhar com colegas de classe – e que ele descobriu apenas uma pequena fração dos bots infratores na Loja GPT. “A ponta do iceberg”, diz Blichfeldt Andersen.
É fácil encontrar bots na GPT Store cujas descrições sugerem que eles podem estar explorando conteúdo protegido por direitos autorais de alguma forma, como Techcrunch observado em um artigo recente alegando que a loja da OpenAI foi invadida por “spam”. A utilização de material protegido por direitos de autor sem permissão é permitida em alguns contextos, mas noutros os detentores de direitos podem tomar medidas legais. A WIRED encontrou um GPT chamado Westeros Writer que afirma “escrever como George RR Martin”, o criador do A Guerra dos Tronos. Outra, Voice of Atwood, afirma imitar a escritora Margaret Atwood. Ainda outro, Write Like Stephen, pretende imitar Stephen King.
Quando a WIRED tentou enganar o bot King para que revelasse o “prompt do sistema” que ajusta suas respostas, o resultado sugeriu que ele tinha acesso às memórias de King Sobre a escrita. Write Like Stephen conseguiu reproduzir passagens do livro literalmente sob demanda, até mesmo anotando de qual página o material veio. (A WIRED não conseguiu entrar em contato com o desenvolvedor do bot porque não forneceu endereço de e-mail, número de telefone ou perfil social externo.)
A porta-voz da OpenAI, Kayla Wood, diz que responde a solicitações de remoção de GPTs feitas com conteúdo protegido por direitos autorais, mas se recusou a responder às perguntas da WIRED sobre a frequência com que atende a tais solicitações. Ela também diz que a empresa procura proativamente GPTs problemáticos. “Usamos uma combinação de sistemas automatizados, revisão humana e relatórios de usuários para encontrar e avaliar GPTs que potencialmente violam nossas políticas, incluindo o uso de conteúdo de terceiros sem a permissão necessária”, diz Wood.
Novas disputas
O problema de direitos autorais da loja GPT pode aumentar as dores de cabeça legais existentes da OpenAI. A empresa enfrenta uma série de ações judiciais de grande repercussão alegando violação de direitos autorais, incluindo uma movida por O jornal New York Times e vários trazidos por diferentes grupos de autores de ficção e não-ficção, incluindo grandes nomes como George RR Martin.
Os chatbots oferecidos na GPT Store da OpenAI são baseados na mesma tecnologia de seu próprio ChatGPT, mas são criados por desenvolvedores externos para funções específicas. Para personalizar seu bot, um desenvolvedor pode fazer upload de informações extras que podem ser aproveitadas para aumentar o conhecimento incorporado à tecnologia OpenAI. O processo de consultar essas informações adicionais para responder às dúvidas de uma pessoa é chamado de geração aumentada de recuperação, ou RAG. Blichfeldt Andersen está convencido de que os arquivos RAG por trás dos bots na GPT Store são um viveiro de materiais protegidos por direitos autorais carregados sem permissão.