Derechos autorales e IA Generativa
Derechos autorales e IA Generativa, una aproximación histórica y fenomenológica
Autor: Rodrigo Alejandro Gómez Torre
Resumen: El texto explora la evolución de la inteligencia artificial (IA), destacando su origen en el concepto creado por John McCarthy en 1956, y se enfoca específicamente en la IA generativa, que crea contenido original. Con el surgimiento de plataformas como ChatGPT en 2022, la IA generativa alcanzó gran popularidad y trajo a la luz cuestiones complejas sobre derechos de autor. El autor analiza cómo la creación de contenido por IA desafía la estructura tradicional de la propiedad intelectual, basada en la relación autor-obra-consumidor. La IA generativa, al apoyarse en datos de terceros sin claridad sobre el respeto a los derechos de autor, plantea preocupaciones sobre el plagio y la protección de obras preexistentes. La conclusión sugiere que el marco jurídico actual necesita adaptarse para enfrentar los impactos de la IA, con el fin de proteger la cultura y el conocimiento, en lugar de reforzar la concentración de beneficios y datos en las grandes corporaciones tecnológicas.
Introducción
No existe un concepto único de Inteligencia Artificial, ya que este es un denominador genérico que se puso de moda en la sociedad en los últimos años para hacer referencia a un conjunto de tecnologías amplio y disímiles entre ellas. Es por esto por lo que el concepto de Inteligencia Artificial es un concepto vacío de significado que, al mismo tiempo, puede hacer referencia a diversos desarrollos tecnológicos, a ninguno de ellos o a un subgrupo de estos desarrollos en particular.
En la década de 1950, más precisamente en 1956, durante una conferencia en Dartmouth, un joven doctor llamado John McCarthy expuso sobre las máquinas y su inteligencia. Fue en esta ponencia que se utiliza por primera vez el termino inteligencia artificial teorizando sobre la posibilidad de crear máquinas con capacidad de interactuar con su entorno y poseer ciertas características cognitivas e intelectuales humanas. Sin embargo, no se debe olvidar que el significante escogido (Inteligencia Artificial), al igual que acontece con muchos de los desarrollos tecnológicos, tuvo una finalidad de impacto publicitario más que la de aportar un concepto cerrado que defina una tecnología.
Con la finalidad de circunscribir este texto a un desarrollo en particular, dentro del denominador genérico Inteligencia Artificial, abordaremos un tipo de desarrollo específico, el de la Inteligencia Artificial Generativa.
Breve recorrido histórico y fenomenológico del desarrollo tecnológico
Con la irrupción en el año 2022 de ChatGPT, a fuerza de una buena inversión publicitaria y el juego psicológico de un futuro distópico, el mundo comenzó a hablar de las luces y las sombras que acarrearía para la sociedad la “Inteligencia Artificial”. El mundo académico no se quedó de lado y también proliferaron los artículos, las reuniones científicas así como los cursos de grado y posgrado sobre “Inteligencia Artificial”.
En este texo, fuera de la fuerza publicitaria del producto, queremos destacar que el desarrollo de Chat GPT estuvo a cargo de Open IA (y Microsoft Corporation) y fueron estos quienes desarrollaron el GPT 1 en el año 2018; sin embargo el lanzamiento comercial y posterior masificación ocurrió en noviembre del 2022 con la irrupción de ChatGTP. Este producto, en tono de bien comercializable, alcanzó un poder de penetración incomparable con las anteriores plataformas. Llegó a los 100 millones de usuarios en sólo 2 meses. Aportamos, para que el lector tenga noción del impacto social del desarrollo tecnológico, el tiempo que le demandó a otras plataformas (continuando con las licencias lingüísticas para identificar a intermediarios o Prestadores de Servicio de Internet) alcanzar esa penetración entre los usuarios. Instagram precisó 26 meses mientras que en el abordaje histórico no olvidamos a las viejas y añorables plataformas de comienzo de siglo XXI, Facebook precisó 54 meses y Twitter, ahora X, necesitó consumir 65 meses alcanzar ese mismo nivel de penetración.
Para comenzar a adentrarnos en el breve aporte que realizaremos en este texto, comenzaremos aplicando algunos criterios científicos que delimiten el objeto de nuestra temática. Nos nutriremos de las herramientas desarrolladas por la Egología del Derecho, que afirma la importancia que tiene (sobre todo para los juristas) el desapegarse de la concepción normativista en donde todo el fenómeno jurídico se subsume a la ley.
Si el lector comprende que la realidad no es lo que la norma establece, sino que muy por el contrario, existe un dato prenormativo que es la conducta y desde allí las normas tratan (y lo consiguen en mejor o peor medida) de hacerse cargo de ellas regulándolas de una determinada forma; podrá observar que las normas jurídicas (las leyes) son sólo un aspecto del fenómeno jurídico y que ellas se moldean conforme al devenir de estos acontecimientos previos. De allí que no concordemos con la mayoría de autores que frente a cada novedad social sentencian en forma simple y llana “el fenómeno no se amolda a la ley, por lo tanto es una actividad ilegal/alegal hasta que lo haga”.
Procurando individualizar al fenómeno prenormativo, reiteraremos que tomamos como concepto de IA Generativa a la rama de la inteligencia artificial capaz de generar contenido novedoso, en contraposición a la simple acción de analizar o actuar sobre datos ya existentes, como lo hacen la mayoría de los sistemas expertos actuales.
Observe el lector que se destaca el término novedoso y no se utiliza intencionalmente la palabra original, ya que justamente la originalidad (concepto escabroso por demás), es uno de los requisitos que la normativa vigente en derecho autoral valora en las creaciones intelectuales para tutelar los derechos de los sujetos que gozarán de las asignaciones legales que el ordenamiento les reconoce o brinda.
Profundizando en el desarrollo tecnológico, diremos que este tipo de algoritmos computacionales contienen modelos discriminadores o Transformers (transformadores) entrenados en un corpus o conjunto de datos, capaz de mapear la información de entrada en un espacio latente de alta dimensión y poseen un modelo generador que impulsa un comportamiento estocástico, creando contenido novedoso en cada intento, incluso con los mismos estímulos de entrada.
Al analizar la tecnología de las IA generativas, se debe tener presente el concepto de Modelos de Lenguaje de Gran Escala o LLM por su acrónimo en el idioma inglés. Estos son una subcategoría de la IA generativa que se especializan en generar texto. Un LLM es un programa de ordenador que se entrenó (con un conjunto de datos u obras autorales previamente identificadas) básicamente para generar texto frente a los requerimientos/preguntas (PROMPTS) que le incorpora el prosumidor.
Una vez entrenado (o parametrizado) con millones de datos que se obtuvieron, sin que terceros a la empresa titular del algoritmo computacional tengan constancia del negocio jurídico por el cual se desarrolló ese entrenamiento (utilización, reproducción y/o aprovechamiento de obras), la IA generativa puede generar oraciones y párrafos completos que son coherentes y de difícil diferenciación con la producción humana. Esa labor la realiza simplemente a partir de un estímulo o PROMPT inicial incorporado por el prosumidor.
De allí ocurre que parte de la doctrina se cuestione si estas obras, las producidas por la utilización de estos algoritmos computacionales, puedan ser consideradas como nuevas obras originales para que se le entreguen asignaciones legales a algún sujeto de derecho (sea el prosumidor o las empresas titulares del algoritmo computacional) o si por el contrario son obras que están vulnerando los derechos de terceros, por el plagio en el que podrían estar incurriendo al haberse “alimentado” de ellas sin el consentimiento del titular de los derechos de esas obras.
Es interesante destacar en este pasaje que la mayoría de la doctrina tiene un concepto de que se entiende por plagio, sin embargo, no es común que se sepa de donde surgió ese denominador. Según nuestras investigaciones podemos afirmar que ese concepto surgió de la mano de un poeta. Marcus Valerius Martialis, más conocido en nuestros días como MARCIAL. Marco Valerio Marcial fue un poeta nacido en el año 40 de la era común en la zona de Calatayud, ciudad que actualmente pertenece a Zaragoza, Reino de España.
Según consta en los registros consultados, la primera cita que se realiza sobre el origen del concepto de plagio la realizó Agustin Renouard en su obra Traité des droits d` auteurs del año 1838 en donde identifica que fue MARCIAL quien tuvo la ocurrencia de utilizar la palabra “plagiarius” para denominar a quien se adueñaba de sus versos. “Plagium” era una voz de derecho que se utilizaba para tipificar el delito de quien vendía un esclavo ajeno como propio, o a un hombre libre como esclavo. Así pensó este poeta que podría llamar plagiarius a quien se hacía pasar por dueño de sus versos sin realmente serlo, hecho que nos puede llevar a pensar como podría aplicarse esa analogía a los sujetos que operan en torno a la tecnología de la Inteligencia Artifical Generativa.
Consideraciones finales
Entendemos que el fenómeno prenormativo que regula la normativa de Propiedad Intelectual, continúa conformado por la triada indisoluble de autor-obra-consumidor; resignificando que este último elemento ha virado desde hace ya varios años para ser prosumidor.
Con la irrupción de los algoritmos computacionales de la IA Generativa se rompen los modelos de negocios previos que imperaban en el Capitalismo Cognitivo, ya que los roles de los sujetos de la triada no están tan claramente identificados, y , además de ello, los actores jurídicos pueden (según su interés) desempeñar más de una de las tradicionales funciones asignadas a cada uno de los sujetos que secundan la creación de obras del intelecto.
Sin embargo, no queremos dejar de destacar que en todo este análisis seguimos encontrando sujetos que se dedican a la distribución y comercialización de obras autorales (o conocimiento). Estos continúan siendo intermediarios y si bien estos intermediarios aparecen para dar orden a un conjunto caótico de información que aparece en medio del intercambio de contenido cultural, lo hacen con visos económicos. Es decir, con la finalidad de obtener la mayor rentabilidad posible a la inversión realizada para perfeccionar los algoritmos computacionales que ponen a disposición del usuario o prosumidor.
Las compañías tecnológicas, que se encuentran detrás de lo que también se ha dado por individualizar en forma genérica como “plataformas”, cuentan con un componente extra que es la posibilidad de compartir los contenidos, calificarlos, relacionarlos con otros, reordenarlos y gracias a la arquitectura Transformers de los LLM, hasta de crearlos.
Sin embargo, esa creación tampoco surge ex nihilo. Esas creaciones se hicieron con base en la parametrización de los algoritmos y sin que en la actualidad tengamos acceso a suficiente información como para saber si en ese procedimiento se respetaron las normativas que imperan actualmente, es decir, si la información o conocimiento con la que se entrenó el algoritmo computacional se encontraba en dominio público o inmersa en algunas de las excepciones a la privatización de las mismas; o incluso si hasta se compensó económicamente a los autores de las obras utilizadas para parametrizar el algoritmo.
Estimamos que frente a este nuevo desafío que representan para la convivencia en sociedad los algoritmos computacionales de titularidad de estas grandes corporaciones tecnológicas, desde la academia debemos rehusar a la simple denuncia de la falta de adecuación a la norma actual de estas nuevas realidades.
Difícilmente las normas decimonónicas que normativizaron en su momento la creación intelectual puedan dar respuesta a estas nuevas realidades. Por ello estimamos que es parte de nuestras labores como académicos, la generación de herramientas apropiadas para que los órganos estatales que la sociedad ha destinado como encargados de generar las normas jurídicas que regulan las asignaciones legales en democracia, puedan adaptar o crear normas nuevas que distribuyan los recursos de la forma más eficiente posible.
Todo ello teniendo como finalidad la circulación de conocimientos, la generación de más y mejor cultura; aun cuando ello no contribuya a los fines de concentración de rentas e información en los grupos concentrados que vienen aprovechando económicamente la falta de regulación de los modelos de negocios que florecieron en el Capitalismo Cognitivo.