Home Economia Venda de dados de usuário do Reddit para treinamento de IA atrai consulta da FTC

Venda de dados de usuário do Reddit para treinamento de IA atrai consulta da FTC

Por Humberto Marchezini


Reddit disse à frente de seu IPO na próxima semana, que o licenciamento de postagens de usuários para o Google e outros para projetos de IA poderia gerar US$ 203 milhões em receitas nos próximos anos. A plataforma comunitária foi forçada a divulgar na sexta-feira que os reguladores dos EUA já têm dúvidas sobre essa nova linha de negócios.

Em um registro regulatórioReddit disse que recebeu uma carta da Comissão Federal de Comércio dos EUA na quinta-feira perguntando sobre “nossa venda, licenciamento ou compartilhamento de conteúdo gerado pelo usuário com terceiros para treinar modelos de IA”.

A FTC, o principal regulador antitruste do governo dos EUA, tem o poder de sancionar empresas que se envolvam em práticas comerciais injustas ou enganosas. A ideia de licenciar conteúdo gerado por usuários para projetos de IA atraiu dúvidas de legisladores e grupos de direitos sobre riscos de privacidade, justiça e direitos autorais.

O Reddit não está sozinho na tentativa de ganhar dinheiro com o licenciamento de dados, incluindo aqueles gerados pelos usuários, para IA. O site de perguntas e respostas sobre programação Stack Overflow assinou um acordo com o Google, a Associated Press assinou um com a OpenAI e a Automattic, proprietária do Tumblr disse está trabalhando “com empresas de IA selecionadas”, mas permitirá que os usuários optem por não ter seus dados repassados. Nenhum dos licenciantes respondeu imediatamente aos pedidos de comentários. Reddit também não é a única empresa que recebe uma carta da FTC sobre licenciamento de dados, Axios relatado na sexta-feira, citando um ex-funcionário não identificado da agência.

Não está claro se a carta ao Reddit está diretamente relacionada à análise de outras empresas.

O Reddit disse na divulgação de sexta-feira que não acredita ter se envolvido em quaisquer práticas injustas ou enganosas, mas alertou que lidar com qualquer inquérito governamental pode ser caro e demorado. “A carta indicava que a equipe da FTC estava interessada em se reunir conosco para saber mais sobre nossos planos e que a FTC pretendia nos solicitar informações e documentos à medida que sua investigação continuasse”, diz o documento. Reddit disse que a carta da FTC descreveu o escrutínio como relacionado a “um inquérito não público”.

Reddit, cujos 17 bilhões de postagens e comentários são vistos por especialistas em IA como valiosos para treinar chatbots na arte da conversação, anunciou um acordo no mês passado licenciar o conteúdo para o Google. Reddit e Google não responderam imediatamente aos pedidos de comentários. A FTC se recusou a comentar.

Chatbots de IA como o ChatGPT da OpenAI e o Gemini do Google são vistos como uma ameaça competitiva para o Reddit, editores e outras empresas baseadas em conteúdo e apoiadas por anúncios. No ano passado, a perspetiva de licenciar dados a criadores de IA surgiu como uma potencial vantagem da IA ​​generativa para algumas empresas.

Mas a utilização de dados recolhidos online para treinar modelos de IA levantou uma série de questões que circulam em salas de reuniões, tribunais e no Congresso. Para o Reddit e outros cujos dados são gerados pelos usuários, essas questões incluem quem realmente possui o conteúdo e se é justo licenciá-lo sem dar uma parte ao criador. Pesquisadores de segurança descobriram que os modelos de IA podem vazar dados pessoais incluídos no material usado para criá-los. E alguns críticos sugeriram que os acordos poderiam tornar as empresas poderosas ainda mais dominantes.



Source link

Related Articles

Deixe um comentário