Dona do ChatGPT e um dos principais nomes por trás do hype da inteligência artificial generativa, a OpenAI encontrou um obstáculo para seguir na crista dessa onda: os direitos autorais dos criadores de conteúdo.

Os problemas de copyright ganharam notoriedade com a disputa judicial envolvendo a empresa comandada por Sam Altman e o The New York Times. Em um  processo movido no fim do ano passado, o jornal americano acusa a OpenAI e a Microsoft, investidora da companhia, de se apropriarem indevidamente de conteúdos de sua propriedade.

Em uma apresentação recente feita ao Comitê de Comunicações e Seleção Digital da Câmara dos Lordes em defesa de seu negócio, a OpenAI expôs em um dos trechos a seguinte mensagem: é impossível treinar os principais modelos de inteligência artificial de hoje sem usar materiais protegidos por direitos autorais.

A empresa justifica essa impossibilidade ao afirmar que os direitos autorais “abrangem praticamente todo tipo de expressão humana – incluindo postagens em blogs, fotografias, postagens em fóruns, fragmentos de código de software e documentos governamentais”.

A companhia também afirma que “limitar dados de treinamento a livros e desenhos de domínio público criados há mais de um século poderia render uma experiência interessante, mas não forneceria sistemas de inteligência artificial que atendessem às necessidades dos cidadãos de hoje”.

Ainda assim, a OpenAI diz que cumpre todas as leis de direitos autorais enquanto faz o treinamento de seus modelos de inteligência artificial. Segundo a empresa, o uso de materiais de internet disponíveis, como as reportagens do The New York Times, não infringe nenhuma lei.

Em relação ao processo, a OpenAI não deu uma resposta clara, mas observou que a companhia estava negociando uma parceria com o jornal para obter acesso às reportagens. O último contato entre as partes foi feito no dia 19 de dezembro, pouco antes da ação ser registrada.

O jornal americano não é o único incomodado com as práticas da empresa de tecnologia. Em outros processos contra a OpenAI, os demandantes acusam a companhia de utilizar seus conteúdos para benefício próprio e sem pagar qualquer valor pelo uso ou ceder parte do lucro obtido com a prática.

Os criadores defendem o argumento de que podem ganhar dinheiro com o tráfego a partir da publicidade digital exibida nas páginas onde o conteúdo está alocado. Mesmo que as big techs, como o Google, controlem os termos da divisão quando hospedam os anúncios nas páginas.

Um estudo realizado pela Universidade de Columbia e a Universidade de Houston, nos Estados Unidos, aponta que se o Google tivesse cedido aos criadores uma fatia de 50% do valor gerado por conteúdo noticioso, a empresa teria que desembolsar pelo menos US$ 10 bilhões anualmente, conforme relata o Financial Times.

Entre esses criadores de conteúdo estão autores como John Grisham, Jodi Picoult e George RR Martin. Em setembro, o trio, ao lado de outros 14 demandantes, processou a OpenAI por “roubo sistemático em larga escala”.

O Google, aliás, também está sendo alvo de uma ação por vinculação ilegal de conteúdo do site de notícias americano Helena World Chronicle. Parte do conteúdo vem sendo utilizada pela empresa de Mountain View em resultados do Bard, sua ferramenta de inteligência artificial que compete com o ChatGPT.

Outras plataformas também estão próximas de ficarem no banco dos réus. A Getty Images está processando a Stable Diffusion, empresa que controla o programa Stability AI, que cria imagens artificiais. Já a Anthropic, apoiada pela Amazon, está na mira de um grupo de editoras de música que inclui a Universal Music.

O contra-ataque da indústria de mídia contra as empresas de inteligência artificial marca um novo capítulo em relação às disputas de direitos autorais que se intensificaram com a disponibilização de conteúdo em meios digitais.

No passado, o Google já foi alvo de processos sob a alegação de que usuários utilizavam o YouTube para publicar trechos de programas exibidos em emissoras de TV. Outro nome que se acostumou a estar no centro dessas queixas, sob a alegação de lucrar com o conteúdo de terceiros, sem repassar nenhuma parcela desses ganhos, foi o Facebook.