Meta usó BitTorrent para descargar 80 TB de libros con copyright y entrenar su IA

Meta, la empresa matriz de Facebook, se encuentra en medio de una demanda colectiva que la acusa de infringir derechos de autor y competir de manera desleal en el entrenamiento de su modelo de inteligencia artificial LLaMA. Documentos judiciales han revelado que la compañía descargó 81.7 TB de datos desde bibliotecas en clandestinas como Anna’s Archive, Z-Library y LibGen, utilizando torrents pirateados para alimentar su sistema.

Mensajes internos muestran que varios empleados expresaron su preocupación por el uso de material pirata en el entrenamiento de la IA. En octubre de 2022, un investigador senior advirtió: “No creo que debamos usar material pirateado. Realmente necesito trazar una línea aquí”. Otro empleado reforzó esta postura al decir: “Esto debería estar más allá de nuestro umbral ético”, y comparó fuentes como Sci-Hub, ResearchGate y LibGen con The Pirate Bay.

Meta usó BitTorrent para descargar 80 TB de libros

En enero de 2023, Mark Zuckerberg participó en una reunión donde presionó para “seguir adelante y desbloquear todo esto”. Tres meses después, otro empleado expresó su inquietud por el uso de direcciones IP de Meta para acceder a contenido pirata, y añadió: “Descargar torrents desde una laptop corporativa no se siente bien”, acompañado de un emoji de risa.

Meta intentó ocultar su rastro

Los documentos judiciales también revelan que Meta tomó medidas para que su infraestructura no fuera utilizada directamente en la descarga y distribución de estos archivos, evitando así que la actividad fuera rastreada hasta la empresa. Para los demandantes, esto es una prueba clara de que Meta actuó deliberadamente para eludir las leyes de derechos de autor.

Este no es el primer escándalo de este tipo en la industria de la inteligencia artificial. En junio de 2023, OpenAI fue demandada por novelistas que alegaban que su IA fue entrenada con sus libros sin permiso. En diciembre, The New York Times presentó una demanda similar. Por su parte, Nvidia enfrenta un litigio por haber usado 196,640 libros en el entrenamiento de su modelo NeMo, que terminó siendo eliminado tras las acusaciones.

Además, un ex empleado de Nvidia reveló en agosto pasado que la empresa recopilaba más de 426,000 horas de videos diariamente para entrenar sus modelos de IA. Más recientemente, OpenAI ha comenzado a investigar si la empresa DeepSeek accedió ilegalmente a datos de ChatGPT, lo que demuestra lo irónico que puede llegar a ser este escenario.

El caso contra Meta sigue en curso, y aún no hay una decisión final. Si la empresa es declarada culpable, es probable que apele la sentencia, lo que podría prolongar el proceso durante varios meses o incluso años.

OpenAI acusa a DeepSeek de robar su tecnología para entrenar su IA

Labels: inteligencia artificial

Tu opinión es importante para mí, porque me ayuda a mejorar. Si te gustó el articulo o tienes alguna sugerencia, déjame tu comentario con tu nombre para poder responderte tan pronto como pueda.

Publicar un comentario (0)

Meta usó BitTorrent para descargar 80 TB de libros con copyright y entrenar su IA

Meta intentó ocultar su rastro

Formulario de contacto