Anna’s Archive, a well-known digital pirate library, claims to have made a massive 'backup' of Spotify that includes some 86 millions of audio files and metadata from around 256 millions of tracks, which represents 99,6% of all the music that is actually listened to on the platform. The dump takes up about 300 TB and is being distributed via torrents organized by popularity, with a first block of metadata of about 200 GB and subsequent batches of music, making it the largest music heist in history and an archive of enormous analytical value about Spotify's catalog.
The data clearly show the 'long tail' phenomenon: more than 70% of the songs in the catalog have fewer than 1.000 plays, mientras que una fracción ínfima concentra casi todas las escuchas. De los aproximadamente 86 millones de temas copiados, solo unas 210.000 canciones superan cierto umbral de popularidad, apenas un 0,1% del total, lo que confirma que la mayoría de usuarios escucha, in fact, un conjunto muy reducido de canciones frente a un océano de pistas prácticamente ignoradas. El archivo incluye, In addition, listados como el top 10.000 de canciones más populares, donde aparecen artistas como Lady Gaga, Bad Bunny o Billie Eilish en las primeras posiciones.
Spotify ha respondido abriendo una investigación interna y desactivando las cuentas que habrían sido usadas para realizar scraping masivo, subrayando que no se ha comprometido información privada de usuarios y que el incidente no ha sido un “hackeo” clásico de sus sistemas, sino un abuso sistemático del acceso a través de cuentas de usuario y técnicas de extracción automatizada. La compañía afirma haber desplegado nuevas salvaguardas contra este tipo de ataques y mantiene que este tipo de copias viola tanto sus términos de uso como los derechos de autor, mientras el caso reabre el debate sobre la preservación digital, la piratería y hasta qué punto las grandes plataformas controlan realmente la explotación de sus catálogos.
Fountain: Engadget