/Um novo processo poderia significar grandes problemas para o principal cão da indústria de IA? Com certeza parece.
Uma nova ação coletiva acusa o criador do ChatGPT, OpenAI, de coletar dados de forma criminosa de toda a Internet e, em seguida, usar os dados roubados para criar seus populares produtos automatizados. O processo, aberto esta semana pela Clarkson Law Firm em um tribunal do norte da Califórnia, é apenas o mais recente de uma série de desafios legais que atingem o cerne do modelo de negócios da influente startup.
Desde que passou de uma humilde organização de pesquisa para um negócio com fins lucrativos em 2019, a OpenAI está em uma ascensão meteórica até o topo da indústria de tecnologia. Quando lançou o ChatGPT em novembro passado, a empresa se tornou um nome familiar.
Mas enquanto a OpenAI tenta levantar seus negócios e estabelecer as bases para uma expansão futura, a natureza controversa da tecnologia que está vendendo pode sabotar suas próprias ambições. Dada a radicalidade e a novidade da indústria de IA, faz sentido que questões legais e regulatórias se desenvolvam. E se desafios legais como o apresentado esta semana prevalecerem, eles podem minar a própria existência dos produtos mais populares da OpenAI e, por sua vez, podem ameaçar a nascente indústria de IA que gira em torno deles.
As alegações do processo Clarkson, explicadas
A alegação central no processo de Clarkson é que todo o modelo de negócios da OpenAI é baseado em roubo. O processo acusa especificamente a empresa de criar seus produtos usando “informações privadas roubadas, incluindo informações de identificação pessoal, de centenas de milhões de usuários da Internet, incluindo crianças de todas as idades, sem seu consentimento informado ou conhecimento”.
É sabido que os grandes modelos de linguagem do OpenAI – que animam plataformas como ChatGPT e DALL-E – são treinados em grandes quantidades de dados. Muitos desses dados, a startup admitiu abertamente, foram extraídos da internet aberta. Em geral, a maior parte da raspagem da web é legal , embora existam algumas rugas nessa fórmula básica. Embora a OpenAI tenha afirmado que tudo o que faz é honesto, ela também foi repetidamente criticada.por falta de transparência em relação às fontes de alguns de seus dados. De acordo com o processo desta semana, as práticas de aspiração da startup são flagrantemente ilegais; especificamente, o processo acusa a empresa de violar os contratos de termos de serviço de várias plataformas, ao mesmo tempo em que entra em conflito com vários regulamentos estaduais e federais – incluindo leis de privacidade.
Apesar dos protocolos estabelecidos para a compra e uso de informações pessoais, os réus adotaram uma abordagem diferente: roubo. Eles sistematicamente extraíram 300 bilhões de palavras da internet, “livros, artigos, sites e postagens – incluindo informações pessoais obtidas sem consentimento”. A OpenAI fez isso em segredo e sem se registrar como corretora de dados, conforme exigido pela lei aplicável.
O processo também destaca o fato de que, depois que a OpenAI explorou livremente o conteúdo da web de todos, passou a usar esses dados para criar produtos comerciais que agora está tentando vender de volta ao público por somas exorbitantes de dinheiro:
Sem esse roubo sem precedentes de informações privadas e protegidas por direitos autorais pertencentes a pessoas reais, comunicadas a comunidades únicas, para fins específicos, visando públicos específicos, os produtos [OpenAI] não seriam o negócio multibilionário que são hoje.
Se o sistema de justiça dos EUA acabará concordando com a definição de roubo do processo ainda não foi determinado. O Gizmodo procurou a OpenAI para comentar o novo processo, mas não obteve resposta.
Os problemas legais da OpenAI estão se acumulando
O processo de Clarkson não é o único com o qual a OpenAI está lidando atualmente. Na verdade, a OpenAI foi submetida a uma lista cada vez maior de ataques legais, muitos dos quais com argumentos semelhantes.
Apenas nesta semana, outro processo foi aberto na Califórnia em nome de vários autores que dizem que seus trabalhos protegidos por direitos autorais foram copiados pela OpenAI em seu esforço para devorar dados para treinar seus algoritmos. O processo, novamente, basicamente acusa a empresa de roubar dados para alimentar seus negócios – e diz que criou seus produtos “colhendo grandes quantidades” de obras protegidas por direitos autorais sem “consentimento, sem crédito e sem compensação”. Ele continua caracterizando plataformas como ChatGPT como sendo “obras derivadas infratoras” – essencialmente implicando que elas não existiriam sem o material protegido por direitos autorais – “feitas sem a permissão dos Requerentes e em violação de seus direitos exclusivos sob a Lei de Direitos Autorais”.
Ao mesmo tempo, tanto o processo Clarkson quanto o processo dos autores apresentam alguma semelhança com outro processo que foi aberto logo após o lançamento do ChatGPT em novembro passado. Este, arquivado como uma ação coletiva pelos escritórios de Joseph Savari em San Francisco, acusa a OpenAI e seu financiador e parceiro Microsoft de ter roubado codificadores em um esforço para treinar o GitHub Copilot – um assistente virtual orientado por IA. O processo acusa especificamente as empresas de não aderirem aos acordos de licenciamento de código aberto que sustentam grande parte do mundo do desenvolvimento, alegando que, em vez disso, levantaram e ingeriram o código sem atribuição, ao mesmo tempo em que falharam em aderir a outros requisitos legais. Em maio, um juiz federal da Califórniarecusou a moção da OpenAI para arquivar o caso, permitindo que o desafio legal avançasse.
Enquanto isso, na Europa, a OpenAI enfrentou investigações legais semelhantes de reguladores governamentais sobre a falta de proteção de privacidade para os dados dos usuários.
Toda essa turbulência legal ocorre no contexto da ascensão meteórica da OpenAI ao estrelato do Vale do Silício – uma nova posição precária que a empresa está claramente lutando para manter. Enquanto a empresa se defende de ataques legais, o CEO da OpenAI, Sam Altman, tem tentado influenciar como novas leis serão construídas em torno de sua tecnologia de mudança de eixo. De fato, Altman tem cortejado governos em todo o mundo em um esforço para estabelecer as bases para um ambiente regulatório amigável. A empresa está claramente posicionada para ser a líder de fato no setor de IA – se puder enfrentar os desafios contínuos à sua própria existência, é claro.
Fonte: gizmodo