找回密码
 立即注册
搜索
查看: 10693|回复: 64

[科技] spo tify被“拖库”了,300tb音乐文件不日将公开

[复制链接]
发表于 2025-12-22 13:54 来自手机 | 显示全部楼层 |阅读模式
知名数据档案馆安娜的档案抓取流媒体音乐平台 spo tify高达 300TB 的数据,包含 8600 万首歌曲,占总播放量的 99.6%。这部分数据将分阶段发布,其中播放量非零的歌曲以 160kbits 的原始 OGG Vorbis 格式发布,播放量为零的歌曲被重新编码为 75kbits 发布,暂时只有元数据已经发布。查看全文:https://ourl.co/111393

知名数据档案馆安娜的档案日前发布博客宣布已经成功备份几乎整个 ** 平台的音乐文件,后者是全球用户规模最大的流媒体音乐平台,此次被安娜的档案抓取应该是某些安全措施没有做到位导致的。

安娜的档案称,此前该档案馆发现某种能够大规模抓取 ** 平台数据的方法,随后该档案馆意识到或许可以通过数据建立用于保存音乐的音乐档案馆,接下来就是抓取数据。

最终抓取的数据和概述如下:

** 作为全球规模最大的流媒体音乐平台目前拥有 2.56 亿首歌曲,其中 99.9% 的歌曲已经被抓取;

安娜的档案成功存档 8600 万首音乐文件,约占总播放量的 99.6%,整体数据大小约为 300TB;

按照 ** 平台受欢迎程度来确定歌曲的优先级,用户可以查看排名前 10000 的歌曲榜单;

对于流行程度非零的歌曲几乎都已经抓取,75kbit/s 的 OGG Opus 格式;

添加元数据时没有对音频文件进行重新编码,但提供差异文件存档,包含原始哈希和元数据文件用于重建;

对于流行程度为零的歌曲大约抓取了 50%,音频被重新编码为 75kbit/s 的 OGG Opus 格式,这种音质较低但体积小;

数据截止至 2025 年 7 月,也就是在此之后上架的音乐或更新都不包含在下载数据内。

由于数据非常大安娜的档案将以 BT 种子形式发布数据,也就是说除非所有人都已经放弃这部分数据,否则数据将 BT 形式流传在整个互联网上,任何人想要将其彻底清除都几乎是不可能的事情。

不过需要说明的是目前数据还在构建并计划分阶段发布,暂时发布的数据只有歌曲的元数据,接下来音乐文件、附加文件元数据、专辑封面以及 zstdpatch 文件等都将分阶段发布,具体发布时间未知。
回复

使用道具 举报

     
发表于 2025-12-22 13:56 | 显示全部楼层
星号是什么?
回复

使用道具 举报

发表于 2025-12-22 13:56 | 显示全部楼层

测试一下**
s p o t i f y原来是屏蔽词
回复

使用道具 举报

     
发表于 2025-12-22 13:57 | 显示全部楼层
这个300TB还是很有备份价值的,这是被AI污染以前人类创造过的几乎所有音乐的集合。

评分

参与人数 8战斗力 +11 收起 理由
armedangel + 1
ieahgiergn + 1 有道理
narutoz + 1 好评加鹅
elwingh + 2 好评加鹅
苏西踩到我了 + 1
壮岁旌旗拥万夫 + 2 好评加鹅
流浪的翅膀 + 1 好评加鹅
はちたや + 2

查看全部评分

回复

使用道具 举报

     
发表于 2025-12-22 13:58 | 显示全部楼层
本来有些小众音乐人被suno已经整的够惨的了 这连点**播放量的零花钱都不让人挣的吗
回复

使用道具 举报

     
发表于 2025-12-22 13:59 | 显示全部楼层
300t的包
也不是一般人能下的吧

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-12-22 14:00 | 显示全部楼层
jojog 发表于 2025-12-22 13:58
本来有些小众音乐人被suno已经整的够惨的了 这连点**播放量的零花钱都不让人挣的吗
...

会听离线音乐的用户本来也听不到这些人头上
回复

使用道具 举报

     
发表于 2025-12-22 14:00 | 显示全部楼层
强尼高达 发表于 2025-12-22 14:00
会听离线音乐的用户本来也听不到这些人头上

你猜会不会有人做镜像站
回复

使用道具 举报

     
发表于 2025-12-22 14:01 | 显示全部楼层
jojog 发表于 2025-12-22 13:58
本来有些小众音乐人被suno已经整的够惨的了 这连点**播放量的零花钱都不让人挣的吗
...

按现在流行的说法,你小众音乐人就是活该被ai杀死
回复

使用道具 举报

发表于 2025-12-22 14:02 来自手机 | 显示全部楼层
安娜就是慢了点啊,别的都还好
回复

使用道具 举报

     
发表于 2025-12-22 14:03 来自手机 | 显示全部楼层
我不太了解这方面,是有人扒库之后传到anna's archive上,还是archive负责人自己扒的放上去的呀
回复

使用道具 举报

     
发表于 2025-12-22 14:06 | 显示全部楼层
那么300TB数据的存储成本是多少呢……
回复

使用道具 举报

     
发表于 2025-12-22 14:07 来自手机 | 显示全部楼层
ogg是有损压缩格式好像?

----发送自 Sony XQ-AT72,Android 12
回复

使用道具 举报

     
发表于 2025-12-22 14:08 来自手机 | 显示全部楼层
这个不错,我一直想做自己的华语音乐库,要是能下载完配合navidrome就能做自己的音乐电台了


—— 来自 nubia NX712J, Android 14, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2025-12-22 14:10 | 显示全部楼层
狩野すみれ 发表于 2025-12-22 14:07
ogg是有损压缩格式好像?

----发送自 Sony XQ-AT72,Android 12

都160k了肯定是有损啊,不然呢……
回复

使用道具 举报

     
发表于 2025-12-22 14:15 来自手机 | 显示全部楼层
这个就是扒的免费源,声破天免费是有损的

—— 来自 samsung SM-S9110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-12-22 14:18 | 显示全部楼层
300tb有点少啊,感觉扒下来的音质一般
回复

使用道具 举报

     
发表于 2025-12-22 14:40 来自手机 | 显示全部楼层
已经转存115了,虽然估计到倒闭也不会听
回复

使用道具 举报

     
发表于 2025-12-22 14:43 | 显示全部楼层
jojog 发表于 2025-12-22 14:00
你猜会不会有人做镜像站

不会,买个300T存储的主机给人免费听吗,什么赛博雷锋
而且你用什么客户端呢,正常多媒体播放器都不带算法推荐功能的,这和离线播放也没什么区别了
回复

使用道具 举报

发表于 2025-12-22 14:46 | 显示全部楼层
之前看有松树党分享了100TB音乐,

今天发现sp0tify才300TB,

好家伙,松树党自己家就收藏了1/3个sp0tify。

回复

使用道具 举报

发表于 2025-12-22 14:46 来自手机 | 显示全部楼层
160k,音质党根本不会鸟吧,就是免费音质。无非就是没广告

— from samsung SM-S911U1, Android 16, S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2025-12-22 14:46 | 显示全部楼层
opus的压缩效率很高, 油 管很多音频只有130k左右, 要不然为什么声破天会压到160
回复

使用道具 举报

     
发表于 2025-12-22 14:51 | 显示全部楼层
martinoy 发表于 2025-12-22 14:46
160k,音质党根本不会鸟吧,就是免费音质。无非就是没广告

— from samsung SM-S911U1, Android 16, S1 Ne ...

160kbps差不多相当于256kbps的AAC,基本上各大流媒体的主力商用音质都是这个品质

你果作为最早提供数字音乐下载的服务商,iTunes卖的是128kbps还带DRM,后来才升级到256kbps DRM free
回复

使用道具 举报

     
发表于 2025-12-22 14:54 | 显示全部楼层
Jet.Black 发表于 2025-12-22 14:46
之前看有松树党分享了100TB音乐,

今天发现sp0tify才300TB,

100TB CD级别无损的话只相当于1/20,不过这种人很多都是更高码率的HiRes凑的容量,那么可能会到1/50乃至更少
回复

使用道具 举报

发表于 2025-12-22 14:55 | 显示全部楼层
强尼高达 发表于 2025-12-22 14:54
100TB CD级别无损的话只相当于1/20,不过这种人很多都是更高码率的HiRes凑的容量,那么可能会到1/50乃至 ...

反正有损无损都一辈子听不完,有啥区别么

回复

使用道具 举报

头像被屏蔽
发表于 2025-12-22 15:39 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2025-12-22 15:43 | 显示全部楼层
有损啊,那没事了
回复

使用道具 举报

     
发表于 2025-12-22 15:46 来自手机 | 显示全部楼层
我115也就140t多点的容量,而且已经用了110t了

—— 来自 samsung SM-S9110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-12-22 15:47 | 显示全部楼层
之前说E绅士要倒闭转存过一次资源,说了又不到
回复

使用道具 举报

     
发表于 2025-12-22 15:49 来自手机 | 显示全部楼层
时染砂 发表于 2025-12-22 15:39
有人听才有人付钱,而不是这辈子都因为版权没人听然后看着完蛋

90年代中国音乐版权绝对比现在落后,那现 ...

sp○tify本来就免费
回复

使用道具 举报

     
发表于 2025-12-22 16:08 | 显示全部楼层
原来不是无损,那没事了。不过元数据还是有价值的。
回复

使用道具 举报

     
发表于 2025-12-22 16:24 | 显示全部楼层
这是拖下来要拿去养ai吧,流行度数据都有了 标签打好

评分

参与人数 1战斗力 +1 收起 理由
正义路人 + 1 同意

查看全部评分

回复

使用道具 举报

     
发表于 2025-12-22 16:34 | 显示全部楼层
hecas 发表于 2025-12-22 13:59
300t的包
也不是一般人能下的吧

泥潭有个网友可以处理300T的东西,前提是他得把盘里所有的H 片全格掉
回复

使用道具 举报

发表于 2025-12-22 16:40 | 显示全部楼层
15个20T盘,三个硬盘柜而已
回复

使用道具 举报

     
发表于 2025-12-22 16:57 | 显示全部楼层
感觉光文件数量就可以干爆Windows资源管理器了,估计得搭服务才能正常用
回复

使用道具 举报

发表于 2025-12-22 17:47 | 显示全部楼层
强尼高达 发表于 2025-12-22 14:51
160kbps差不多相当于256kbps的AAC,基本上各大流媒体的主力商用音质都是这个品质

你果作为最早提供数字 ...

现在是2025年说的什么老黄历啊

果流媒体现在都能无损 何况itunes

新点的碟都和mora一个码率
回复

使用道具 举报

     
发表于 2025-12-22 18:07 | 显示全部楼层
160k码率有点太低了,举个例子44.1khz采样率,16位深,双声道的无损wav格式是1411.2k码率。

尽管以现在的音频压缩技术水平,320k码率往上绝大部分人已经听不出差别了(其实更低如256kbps也基本听不出来)。但160k属实有点太低了,基本没有收藏价值。
回复

使用道具 举报

     
发表于 2025-12-22 19:18 | 显示全部楼层
石恵 发表于 2025-12-22 17:47
现在是2025年说的什么老黄历啊

果流媒体现在都能无损 何况itunes

我也不知道你的黄历翻到了二零几几年,我网上搜了一下,除了你以外没有人说iTunes Store卖无损
回复

使用道具 举报

     
发表于 2025-12-22 19:24 | 显示全部楼层
太牛了,能整理出来应该挺爽的
回复

使用道具 举报

发表于 2025-12-22 20:10 | 显示全部楼层
tyrant3614 发表于 2025-12-22 18:07
160k码率有点太低了,举个例子44.1khz采样率,16位深,双声道的无损wav格式是1411.2k码率。

尽管以现在的 ...

坏了,我日常听的都是64-128
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 06:59 , Processed in 0.226208 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表