
Apple enfrenta una nueva controversia legal que podría tener un fuerte impacto en el desarrollo de la inteligencia artificial. Una demanda colectiva propuesta acusa a la compañía de haber utilizado millones de videos de YouTube para entrenar sus modelos de IA, sin autorización de los creadores de contenido.
El caso surge a partir de un estudio publicado por investigadores de Apple a finales de 2024, en el que se describe el uso de un conjunto de datos masivo para el desarrollo de tecnología de generación de video. Según los demandantes, este tipo de prácticas podría representar una violación de derechos de autor, ya que implicaría el uso de contenido protegido sin consentimiento, abriendo así un debate clave sobre los límites legales del entrenamiento de modelos de inteligencia artificial con material disponible en internet.
Índice
El origen de la demanda
La demanda fue presentada por varios creadores de contenido, quienes alegan que Apple utilizó un conjunto de datos llamado Panda-70M. Este dataset funciona como un índice que enlaza millones de clips de YouTube, identificando segmentos específicos mediante URLs, IDs de video y marcas de tiempo.
Según los demandantes, sus propios videos aparecen cientos de veces dentro de este conjunto de datos, lo que habría permitido a Apple acceder y utilizar ese contenido como material de entrenamiento para sus sistemas de inteligencia artificial.
Acusaciones de elusión de protecciones
Uno de los puntos más delicados del caso es la acusación de que Apple habría eludido las protecciones anti-scraping de YouTube. Aunque el dataset contiene enlaces y no archivos directamente, los demandantes sostienen que acceder a cada clip implicaría descargar contenido protegido.
Esto podría representar una violación directa de derechos de autor, ya que cada fragmento utilizado se consideraría una acción independiente de extracción de contenido.

Amazon y OpenAI también en el centro de la polémica
La controversia no se limita a Apple. Los mismos demandantes también han presentado acciones legales contra otras grandes tecnológicas, incluyendo Amazon y OpenAI, acusándolas de utilizar el mismo conjunto de datos para entrenar sus propios modelos de inteligencia artificial.
Este caso podría convertirse en un precedente clave para la industria, especialmente en un momento donde el entrenamiento de IA depende cada vez más de grandes volúmenes de contenido disponible en internet.
Qué exigen los demandantes
Los creadores buscan que el caso sea certificado como demanda colectiva, lo que permitiría representar a miles de personas cuyos contenidos podrían haber sido utilizados sin consentimiento.
Además, solicitan compensaciones económicas, medidas legales para detener el uso de su contenido y posibles sanciones por infracción de derechos de autor. También piden órdenes judiciales que obliguen a las empresas a dejar de utilizar este tipo de prácticas en el futuro.
El resultado de esta demanda podría redefinir los límites legales del uso de contenido en el entrenamiento de inteligencia artificial, afectando no solo a Apple, sino a toda la industria tecnológica.











