El auge de la inteligencia artificial generativa exhibe, al menos, dos facetas. Una de ellas es encantadora: las máquinas ahora son capaces de crear contenido y emular capacidades que, poco tiempo atrás, eran exclusivas de los humanos. En la otra cara de la IA aparecen inconvenientes y una de las variables más problemáticas es el entrenamiento de esos sistemas, que precisan muchos datos. ¿Los creadores de chatbots respetan las leyes de propiedad intelectual cuando inyectan contenido en sus desarrollos?
Las demandas por violaciones al copyright se han multiplicado tras el despliegue de tecnologías como ChatGPT y Gemini, en muchos casos presentadas por artistas que descubrieron a los desarrolladores empleando sus obras sin permiso ni retribuciones. Esta semana, nos enteramos de un nuevo caso que profundiza la problemática. Un grupo de escritores presentó una queja ante la justicia por supuestas prácticas indebidas de Anthropic, la firma detrás del bot Claude.
Chatbots y entrenamiento con datos: 3 claves del conflicto
- Los sistemas basados en inteligencia artificial son entrenados con datos. Por ejemplo, para escribir un poema que emule el estilo de Pablo Neruda, es necesario que previamente haya recibido (leído, en modo mecánico) la obra del autor chileno.
- Al usar contenido protegido por derechos de autor, los desarrolladores de chatbots deberían reconocer creadores originales. Y esto no siempre ocurre. Tal como señalamos, en el último año proliferaron las denuncias y demandas contra empresas especializadas en IA, por supuestas violaciones a los derechos de propiedad intelectual.
- La problemática no se restringe a la escena literaria. También hemos visto demandas presentadas por fotógrafos, dibujantes y medios de comunicación.
Escritores demandan a Anthropic, creador del chatbot Claude
Tres autores presentaron una demanda contra el desarrollador de Claude —un chatbot que funciona de un modo similar a ChatGPT— alegando que han construido “un negocio multimillonario robando cientos de miles de libros protegidos por derechos de autor”.
Los demandantes son la periodista Andrea Bartz; el autor de The Feather Thief, Wallace Johnson; y Charles Graeber, autor de El ángel de la muerte.
Siguiendo el repaso de Xataka, en la demanda se afirma que Anthropic descargó y reprodujo copias de The Pile y Books3 —bases con grandes volúmenes de obras literarias— incluso sabiendo que estos conjuntos de datos contienen material protegido por derechos de autor. En este marco, quieren que la empresa los compense por daños y perjuicios. Además, procuran que se impida a Anthropic el uso de esos contenidos para robustecer a su modelo de lenguaje masivo (LLM), la gran maquinaria detrás de su chatbot.
“Un cruel desprecio de los derechos”
En septiembre del año pasado, otro grupo de autores apuntó a OpenAI —la organización detrás de ChatGPT— por haber entrenado al chatbot con obras que están protegidas con copyright. En función de ello, notaron que los demandados se benefician del “uso ilegal y no autorizado” del contenido.
“Los actos de infracción de derechos de autor de OpenAI han sido intencionales, deliberados y con un cruel desprecio de los derechos de los miembros del grupo”, señalaron en la demanda. Además, comentaron que la empresa “supo en todo momento relevante que los conjuntos de datos que utilizó para entrenar sus modelos GPT contenían materiales protegidos por derechos de autor y que sus actos violaban los términos de uso”.
En julio, otra agrupación de escritores emprendió acciones legales contra OpenAI por el uso indebido de contenido en ChatGPT. En ese grupo figuraron Christopher Golden, Sarah Silverman y Richard Kadrey, entre otros. Antes, los autores Mona Awad y Paul Tremblay también habían presentado una demanda contra la organización que dirige Sam Altman.