Banner imascotas.cl
Alguien ha copiado el 99% de lo que se escucha en Spotify. Los 300 TB resultantes revelan un secreto incómodo: la mayoría es IA

Alguien ha copiado el 99% de lo que se escucha en Spotify. Los 300 TB resultantes revelan un secreto incómodo: la mayoría es IA

Se llama Anna's Archive, y era conocida hasta ahora por ser la mayor biblioteca en la sombra de libros académicos y papers. Pero su último movimiento ha sido más ambicioso, a la par que polémico: realizar una copia de seguridad de casi la totalidad del catálogo de Spotify.

Aunque hay muchos grises en la finalidad de esta copia, el grupo plantea su lanzamiento como un acto de preservación digital ante el riesgo de que millones de canciones desaparezcan si las plataformas de streaming cambian sus licencias o cierran sus servidores. El caso es llamativo por las enormes cifras que ha movido esta biblioteca ilegal.

Un proyecto titánico. El volcado de datos es masivo: pesa algo menos de 300 TB y se está distribuyendo de manera ilegal a través de torrents clasificados por popularidad. Según los responsables, han logrado archivar los metadatos de 256 millones de pistas (el 99,9% del catálogo estimado) y descargar los archivos de audio de 86 millones de canciones. 

A pesar de que este número solo supone el 37% de las pistas totales de la plataforma, el grupo asegura que representa el 99,6% de todas las escuchas reales. Eso sí, aunque el anuncio es ruidoso, la realidad es que solo los metadatos están completamente disponibles.

Ingeniería de preservación. El archivo no es una copia bruta, sino una selección particular para maximizar la historia cultural ahorrando algo de espacio. Para ello, han usado la métrica de la popularidad de Spotify. Las canciones con «Popularidad > 0» se han guardado en su formato original sin recodificar. Eso sí, este proyecto ilegal llega hasta julio de 2025; cualquier material lanzado después puede no estar presente.

Un sacrificio necesario. Además de ponernos en contexto sobre cuánta música hay y cuánto ocupa en las plataformas de streaming, nos dice algo más: hay muchísima música generada con Inteligencia Artificial. Precisamente estas pistas tienen menos de 1.000 reproducciones y popularidad cero. 

Mantener la calidad en estas pistas hubiera supuesto unos 700 TB adicionales, pero se ha recurrido a la codificación de baja calidad: concretamente el códec OGG Opus a 75 kbit/s.

Hay muchísima música generada con IA en la bibilioteca de Spotify; descargarla supondría 700 TB

Hay un problema en el streaming. El grupo justifica en su blog esta acción masiva argumentando que los esfuerzos actuales de preservación son insuficientes. Señalan que los archivos actuales suelen cometer dos errores: centrarse en artistas muy populares o buscar una calidad audiófila extrema (como el formato FLAC), algo que infla el tamaño de los archivos e imposibilita preservar la música.

Mina de metadatos. Más allá del audio, el proyecto ha liberado la mayor base de metadatos musicales del mundo, superando a alternativas abiertas como MusicBrainz (5 millones de ISRCs únicos frente a los 186 millones del archivo). Esto abre la puerta a análisis sin precedentes sobre la energía, o tempo de la música mundial, e incluso permite generar una mezcla aleatoria de verdad (shuffle), algo que los algoritmos sesgados de plataformas como Spotify no permiten.

El papel de Spotify en la ecuación. Los responsables del archivo reconocen que la plataforma sueca fue un gran comienzo para registrar la historia musical moderna, pero argumentan que su modelo de negocio es inherentemente frágil para la preservación: si se pierden las licencias regionales o la empresa cambia de estrategia, la música puede desaparecer. 

Por su parte, la realidad legal de Spotify es estricta: todo su catálogo está blindado por acuerdos de derechos de autor que prohíben el scraping masivo, independientemente de las intenciones de los usuarios. Desde Xataka Móvil hemos contactado con Spotify para conocer cuál es su postura oficial respecto a la preservación de su catálogo a largo plazo y actualizaremos esta entrada en cuanto recibamos respuesta.

Imagen de portada | Composición con imágenes de Diego Thomazini para Shutterstock y Wikimedia Commons

En Xataka Móvil | A la pregunta de qué pasa si cierra la empresa que ha fabricado tu baliza, la respuesta está en la operadora

-
La noticia Alguien ha copiado el 99% de lo que se escucha en Spotify. Los 300 TB resultantes revelan un secreto incómodo: la mayoría es IA fue publicada originalmente en Xataka Móvil por Pepu Ricca .

Diciembre 22, 2025 • 2 horas atrás por: XatakaMovil.com 23 visitas

🔥 Ver noticia completa en XatakaMovil.com 🔥

Comentarios

Comentar

Noticias destacadas


Contáctanos

completa toda los campos para contáctarnos

Todos los datos son necesarios
Banner iofertas.cl