Os demandantes em uma ação coletiva acusando a OpenAI de violar a privacidade dos dados de treinamento abandonaram o caso contra a empresa. O processo foi arquivado sem prejuízo, e os autores têm a opção de voltar a processar, conforme documentos judiciais.A ação, movida pela primeira vez no Distrito Norte da Califórnia em junho, acusa os spiders da OpenAI de “violar os direitos de propriedade e privacidade de todos os indivíduos cujas informações pessoais foram coletadas e desviadas para inclusão nos produtos [da OpenAI]”.

A ação não cita os nomes dos autores, que são identificados apenas pelas iniciais. O Clarkson Law Firm entrou com uma ação coletiva em seu nome.

A OpenAI, como outras empresas de IA generativa, extrai dados publicamente disponíveis da Internet para ajudar a treinar grandes modelos de linguagem.

Várias ações judiciais foram movidas sobre como empresas de IA generativa, como a OpenAI, obtêm e usam dados disponíveis publicamente para treinar seus modelos. A maioria dos casos gira em torno de direitos autorais espinhosos, e não de questões de privacidade. A comediante Sarah Silverman, os escritores Christopher Golden e Richard Kadrey processaram OpenAI e Meta, acusando-os de violação de direitos autorais ao treinar GPT-4 e Llama2.

Em julho, a Comissão Federal de Comércio dos EUA lançou uma investigação sobre os possíveis danos da OpenAI aos consumidores através da recolha de dados e da publicação de informações falsas.

Em agosto, a OpenAI disse que os proprietários de sites agora podem bloquear seus rastreadores da web. Alguns sites, incluindo editores de notícias como o The New York Times, impediram que a OpenAI coletasse seus dados.