Direitos Autorais e Mineração de Dados em Pesquisa: Análise do Caso Kneschke vs. LAION

Direitos Autorais e Mineração de Dados em Pesquisa: Análise do Caso Kneschke vs. LAION

Autora: Luisa Maciel Perez

(Pesquisadora Sênior do GEDAI – Grupo de Estudos de Direito Autoral e Industrial)

Resumo: O artigo examina o caso Kneschke vs. LAION, onde a Corte de Hamburgo permitiu que a organização LAION usasse uma fotografia protegida por direitos autorais para treinamento de IA, alegando que a mineração de dados para pesquisa científica é uma exceção legal na Alemanha e União Europeia. A decisão gera controvérsia, pois permite que empresas comerciais usem essas bases de dados sem autorização dos autores, potencialmente facilitando o uso indevido de obras. No Brasil, essa exceção não se aplicaria, pois a Lei de Direitos Autorais exige permissão explícita.

 

Introdução ao Caso e Contexto Jurídico.

Afirmar que a inteligência artificial traz inúmeros desafios para o direito autoral na esfera nacional e global não representa uma assertiva inédita, sendo então impossível elencar todos os desdobramentos jurídicos causados por esta. Todavia, é sim possível contribuir para o debate, por meio de análise de casos concretos. Este é o intuito do presente artigo.

Em 27 de setembro de 2024, a Corte Regional de Hamburgo, na Alemanha, julgou o Caso nº 310 O 227/23, proposto por Robert Kneschke em face de LAION e.V.. O demandante, um fotógrafo profissional, pleiteava que a demandada se abstivesse de reproduzir uma de suas fotografias em uma base de dados criada para treinamento de inteligências artificiais[1].

Ainda que uma decisão de primeira instância, sujeita a recursos, está sendo amplamente acompanhada por entidades na União Europeia e até mesmo pela própria Organização Mundial da Propriedade Intelectual (OMPI), já que o referido processo potencialmente tornar-se-á precedente em matéria de uso de obras protegidas pelo direito autoral para treinamento de inteligências artificiais no âmbito da União Europeia.

Assim sendo, sua análise se faz fulcral. Inicialmente, faz-se necessário apresentar os fatos. A ré, LAION e.V., é uma organização sem fins lucrativos, financiada por doações e bolsas públicas de pesquisa, a qual tem por objetivo fornecer ao público, de forma totalmente gratuita, bases de dados, modelos de larga escala de machine learning  e códigos[3]. Em essência, tem por objetivo final o ensino de ferramentas básicas para pesquisa em machine learning de larga escala e gestão de dados[3]

Neste contexto, a demandada possui uma base de dados intitulada LAION 5B, que contém mais de cinco bilhões de pares de imagens-texto[4]. A referida base de dados é o objeto central de discussão no processo.

 

Decisão da Corte Regional de Hamburgo e Análise Jurídica.

Conforme relatório do julgado[5], a base dados supramencionada disponibiliza uma tabela com hiperlinks para imagens ou arquivos, os quais são acessíveis publicamente na internet, e informações adicionais, tais como uma descrição em texto da imagem, assim compondo um conjunto de dados de pares imagens-texto, os quais podem ser utilizados no treinamento de inteligências artificiais generativas. 

Para sua criação, a empresa se utilizou de um conjunto de dados de uma empresa externa estado-unidense o qual continha os endereços eletrônicos – URLs – das imagens e suas respectivas descrições textuais. Em seguida, realizava o download das imagens e passava os dados por um software, a fim de confirmar que os textos corretamente correspondiam às imagens, formando pares, filtrando as demais. Finalmente, compôs-se a LAION 5B a partir dos metadados obtidos, especialmente as URLs e imagens[5].

Ocorre que, no decorrer deste processo, a LAION capturou, baixou, analisou e incluiu em sua base de dados uma fotografia do autor, Robert Kneschke, sob proteção autoral, a qual estava disponível online em um sítio eletrônico de uma agência fotográfica. Observou-se que a imagem inclusive continha uma marca d’água, a qual expressamente proibia baixar seu conteúdo por meio de programas automatizados[1].  

Neste contexto, o autor ajuizou a demanda de violação de direitos autorais sob o argumento de reprodução não autorizada de sua obra pelo réu, em clara violação à seção 16 da UrhG – lei de direitos autorais alemã.

Todavia, o entendimento da Corte Regional de Hamburgo foi de improcedência dos pedidos, para a surpresa de muitos profissionais e acadêmicos. Em síntese, entendeu o colegiado ser o caso da exceção prevista na seção 60d da lei de direitos autorais alemã[5]. Isto é, no caso comento a reprodução da fotografia para fins de mineração de textos e dados não representa uma violação aos direitos autorais pois tem por intuito a realização de pesquisa científica, sendo assim permitida por lei[6].

O referido dispositivo alemão é uma concretização do artigo 3 da Diretiva Digital Single Market (DSM) da União Europeia (UE)[7], o qual estabelece que estados membros da UE devem fornecer uma exceção para reproduções e extração de obras por organizações de pesquisa para fins de pesquisa científica e mineração de textos e dados.

Em uma análise mais aprofundada, é possível afirmar que a situação descrita pelo autor, aos olhos da corte alemã, enquadra-se perfeitamente, pelos seguintes motivos. 

Em primeiro lugar, trata-se de um caso de mineração de textos e dados, ou seja, uma análise automatizada de uma obra digital – fotografia – para fins de obtenção de informação – metadados –, conforme seção 44b do Urgh[6] e artigo 2(2) da Diretiva DSM[7]

Em segundo lugar, o objetivo da reprodução é a pesquisa científica, cujo conceito não pode ser demasiado restrito. Conforme destacou o tribunal[5], a criação de base de dados em si, ainda que não associada a um ganho de conhecimento imediato, é uma etapa fundamental do processo para formar conhecimento futuro, por meio do seu uso para o treinamento de sistemas de IA, e assim pode ser considerada pesquisa científica. Portanto, a LAION se enquadra como uma organização de pesquisa autorizada a fazer reprodução para tal intuito, sob o entendimento da seção 60d(2)(1) da UrhG[6], já que possui evidentes interesses não comerciais. 

 

Implicações e Críticas à Decisão.

Por fim, a Corte também desconsiderou o argumento de que a empresa estado-unidense – terceira – teria exercido um degrau de influência na organização de pesquisa ou acesso preferencial aos resultados obtidos, de tal modo que tal argumentação foi afastada, mantendo o enquadramento na exceção descrita na seção 60(d)(2) do UrhG[5] .

Nesse diapasão, a Corte Regional de Hamburgo julgou integralmente improcedentes os pedidos à luz da seção 60d do UrhG c/c artigo 3 da Diretiva DSM. Todavia, a referida decisão não está imune a crítica. 

Inicialmente, há de se destacar destacar que tal resultado não poderia ser traduzido para as cortes brasileiras. Isto se dá, pois, sendo o direito de reprodução de obras exclusivo aos autores e um direito fundamental, conforme artigo 5º, inciso XXVII da Carta Magna[8], somente poderia ser excetuado pelas hipóteses expressas do artigo 46 da Lei nº 9.610/1998, a Lei de Direitos Autorais (LDA)[9]

Em breve leitura do referido dispositivo se observa que não há previsão legal de exceção no caso de mineração de textos e dados para fins de pesquisa científica. A única previsão para fins de estudo seria a do inciso III, a qual prevê a citação em meios de comunicações de passagens de qualquer obra, desde que indicado o nome do autor e a origem da obra, o qual claramente não é o caso. Assim, no âmbito brasileiro, ter-se-ia uma clara violação ao direito exclusivo do autor de fruir e dispor de sua obra, conforme artigo 28 da LDA[9].

Retornando ao contexto europeu, a principal crítica está atrelada ao uso da base de dados da LAION para treinamento de inteligências artificiais. Conforme decisão[5], o fato da base de dados ser usado por outras empresas comerciais para treinamento ou desenvolvimento adicional de sistemas de inteligência artificial é irrelevante para a demanda, já que a pesquisa realizada por empresas comerciais continua sendo uma pesquisa científica (p. 21). 

A Corte igualmente arguiu que a aplicação de base de dados para o efetivo treinamento de inteligências artificiais não é previsível, não podendo ser determinada com segurança jurídica, já que não é possível prever o sucesso da etapa de treinamento ou o conteúdo específico que pode ser gerado por esta inteligência artificial treinada. 

Ora, com a devida vênia, a Corte Regional de Hamburgo opta por uma decisão simplista, que não endereça adequadamente os seus impactos. Ao afastar categoricamente o uso da base de dados para treinamento de inteligência artificial a decisão desconsidera a possibilidade de “data laundering, conforme pontua Isaac Torres[10]

Isto é, segundo o autor, empresas com fins comerciais podem se aproveitar da LAION 5B ou outras bases de dados, sem fins lucrativos, para treinar suas inteligências artificiais, sem ter que observar os direitos autorais de obras. Explica-se.

Se uma empresa comercial cria sua própria base de dados, a partir de pesquisas online, e reproduz o conteúdo para treinamento de inteligências artificiais, está sujeita ao artigo 4(3) da Diretiva DSM[10]. Isto é, para que se aplique a exceção de reprodução de obras protegidas por direitos autorais para fins de mineração de textos e dados é necessário que os titulares de direito não tenham expressamente reservado o uso das obras de maneira apropriada, como meios legíveis por máquinas no caso de conteúdo disponível online, por exemplo a marca d’água presente na fotografia objeto da demanda[7]

Por outro lado, as mesmas empresas podem “obter material de treinamento semelhante sem ter que prestar contas aos titulares de direitos”(p. 31)[10], já que podem se utilizar de bases de dados públicas, como a LAION 5B, respaldadas pelo artigo 3 da Diretiva DSM[7], com o fim de desempenhar suas atividades comerciais. 

Logo, conforme dita o autor, as empresas comerciais se beneficiam de tal brecha para ignorar os direitos dos autores em optar por não ter suas obras treinadas para fins de mineração de textos e dados. Todavia, tal ponto sequer foi abordado pela Corte Regional de Hamburgo.

Por tais razões, ainda que a LAION esteja amparada por exceções de sua lei nacional e Diretiva da UE, a decisão da Corte não pode deixar de considerar seus efeitos secundários, especialmente a potencial fraude a direitos autorais perpetrada por empresas comerciais, por meio da reprodução não autorizada da fotografia de Kneschke em uma base de dados pública.

À luz do exposto, tem-se a esperança que a questão apontada seja devidamente visitada pelas instâncias superiores alemãs, ou até mesmo a Corte de Justiça da UE para que haja a formação de um precedente que adequadamente enderece não somente a possibilidade de reprodução de obras por organizações de pesquisa, mas também garanta os direitos autorais frente às entidades comerciais, preenchendo a brecha legal existente. Por fim, resta-nos somente aguardar os futuros andamentos deste processo com a esperança de uma decisão que forneça a adequada segurança jurídica à matéria.

 

Referências Bibliográficas:

2024 WIPO IP Judges Forum Informal Case Summary – Hamburg Regional Court, Germany [2024]: Robert Kneschke v. LAION e.V., Case No. 310 O 227/23. Disponível em: <https://www.wipo.int/wipolex/en/text/592042>. Acesso em: 29 out. 2024.

2024 WIPO Intellectual Property Judges Forum Promoting transnational dialogue among judiciaries. Disponível em: <https://www.wipo.int/meetings/en/2024/judgesforum2024.html>. Acesso em: 29 out. 2024.

About | LAION. Disponível em: <https://laion.ai/about>. Acesso em: 28 out. 2024.

LAION. Disponível em: <https://laion.ai/>. Acesso em: 29 out. 2024.

Robert Kneschke v. LAION e.V., Case No. 310 O 227/23. , 27 set. 2024. Disponível em: <https://drive.google.com/file/d/1A_vnSJUwlrVovhIqA4rKIFaOktR4TvBt/view>. Acesso em: 29 out. 2024. Traduzido com auxílio de DeepL.

Act on Copyright and Related Rights – Urheberrechtsgesetz – UrhG. Copyright Act of 9 September 1965 (Federal Law Gazette I, p. 1273), as last amended by Article 25 of the Act of 23 June 2021 (Federal Law Gazette I, p. 1858).

Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC.

Constituição da República Federativa do Brasil de 1988. 

Lei de Direitos Autorais. Lei no 9.610/1998.

TORRES, ISAAC YAEL SANDIUMENGE. Copyright Implications of the Use of Generative AI. [s.l.] Universitat Pompeu Fabra, 8 abr. 2023.

Enviar Comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *