Meta, la empresa matriz de Facebook, se encuentra en medio de una demanda colectiva que la acusa de infringir derechos de autor y competir de manera desleal en el entrenamiento de su modelo de inteligencia artificial LLaMA. Documentos judiciales han revelado que la compañía descargó 81.7 TB de datos desde bibliotecas en clandestinas como Anna’s Archive, Z-Library y LibGen, utilizando torrents pirateados para alimentar su sistema.
Mensajes internos muestran que varios empleados expresaron
su preocupación por el uso de material pirata en el entrenamiento de la IA. En
octubre de 2022, un investigador senior advirtió: “No creo que debamos usar
material pirateado. Realmente necesito trazar una línea aquí”. Otro empleado
reforzó esta postura al decir: “Esto debería estar más allá de nuestro umbral
ético”, y comparó fuentes como Sci-Hub, ResearchGate y LibGen con The Pirate
Bay.
En enero de 2023, Mark Zuckerberg participó en una reunión
donde presionó para “seguir adelante y desbloquear todo esto”. Tres meses
después, otro empleado expresó su inquietud por el uso de direcciones IP de
Meta para acceder a contenido pirata, y añadió: “Descargar torrents desde una laptop
corporativa no se siente bien”, acompañado de un emoji de risa.
Meta intentó ocultar su rastro
Los documentos judiciales también revelan que Meta tomó
medidas para que su infraestructura no fuera utilizada directamente en la
descarga y distribución de estos archivos, evitando así que la actividad fuera
rastreada hasta la empresa. Para los demandantes, esto es una prueba clara de
que Meta actuó deliberadamente para eludir las leyes de derechos de autor.
Este no es el primer escándalo de este tipo en la industria
de la inteligencia artificial. En junio de 2023, OpenAI fue demandada por
novelistas que alegaban que su IA fue entrenada con sus libros sin permiso. En
diciembre, The New York Times presentó una demanda similar. Por su parte, Nvidia
enfrenta un litigio por haber usado 196,640 libros en el entrenamiento de su
modelo NeMo, que terminó siendo eliminado tras las acusaciones.
Además, un ex empleado de Nvidia reveló en agosto pasado que
la empresa recopilaba más de 426,000 horas de videos diariamente para entrenar
sus modelos de IA. Más recientemente, OpenAI ha comenzado a investigar si la empresa DeepSeek accedió ilegalmente a datos de ChatGPT, lo que demuestra lo
irónico que puede llegar a ser este escenario.
El caso contra Meta sigue en curso, y aún no hay una
decisión final. Si la empresa es declarada culpable, es probable que apele la
sentencia, lo que podría prolongar el proceso durante varios meses o incluso
años.
OpenAI acusa a DeepSeek de robar su tecnología para entrenar su IA