分享爱泼斯坦案新公开的130余万个文件的下载地址(接近完整)
本帖最后由 =w= 于 2026-2-3 21:03 编辑目前总共是公开了有12个数据集,在美国司法部的官网就有下载
https://www.justice.gov/epstein/doj-disclosures
但是其中只有前8个数据集和第12个数据集是有直接的打包下载的。第9到第11个数据集本来也有直接的打包下载,但很快就被撤掉了。
现在在官网想要下载这3个数据集,就只能单独地去下载每个文件,而这些文件的数量有几十万个。
所以我花了点时间(整个晚上,不断调试,真是垃圾网站)写了爬虫脚本,把这几十万的文件的下载链接给爬了下来。
不过因为美国司法部这个网站的架构非常烂,所以没办法完全爬到所有文件的下载链接,只能是尽可能做到接近完整。
根据爬到的结果,去掉重复的链接,其中:
第9数据集有 260200 个文件下载链接;
第10数据集有 304237 个文件下载链接;
第11数据集有 194076 个文件下载链接。
感兴趣的可以下载:https://wwamp.lanzouu.com/iRLjZ3hljklc
我是通过 aria2 程序在命令行下来批量下载这些文件的:
aria2c -c -i 链接文件名.txt --header='Cookie: justiceGovAgeVerified=true' -j16 -x16 -d 新文件夹名字
必须加这个 Cookie 的请求头,不然会没办法直接下到文件。设置了16个任务同时下载,因为网站接入了 Akamai CDN,速度还挺不错,千兆网的话几个小时应该就能下完了。
建议继续以每10000行或1000行来拆分出更小的下载链接列表,不然一下子添加几十万个下载任务,可能会遇到其他问题。
另外红迪上有人把前8个数据集散乱的PDF给合并整理成了一个PDF,这样更方便查看,感兴趣可以看下:https://www.reddit.com/r/DataHoa ... se_into/?tl=zh-hans
也有分享新公开的文件的打包下载的,不过同样不是完整的:
https://www.reddit.com/r/DataHoa ... /removed_by_reddit/
https://www.reddit.com/r/DataHoa ... s_nuking_thread_we/
https://lemmy.world/post/42440468
如果之前就有下过这些打包了的文件的,也可以和我爬到的文件下载链接交叉对比,然后下载那些没下载到的文件
编辑:
补充多一个整理了下载方式的 GitHub 仓库:
https://github.com/yung-megafone/Epstein-Files
其中的第10、第11数据集,看起来应该就是美国司法部曾经短暂公开提供下载的原始的打包好的压缩包,我不确定,也不知道是否是完整的。
第9数据集就是完全就没把这个压缩包下载下来,因为压缩包的体积很大,下载到四分之一后网站直接报错。
更新:
已经完成了第10、第11数据集的文件比较工作,确认在我爬取的链接里,仅仅多了8个文件,其中:
第10数据集:
EFTA02217416.pdf
EFTA02213287.pdf
EFTA02216282.pdf
EFTA02215786.pdf
第11数据集:
EFTA02205655.pdf
EFTA02205827.pdf
EFTA02209722.pdf
EFTA02209622.pdf
都是和航班订票有关的。
所以这2个数据集直接下载官方打包的压缩包即可,通过 bt 下载
第10数据集:
magnet:?xt=urn:btih:d509cc4ca1a415a9ba3b6cb920f67c44aed7fe1f&dn=DataSet%2010.zip
大小:78.640 GiB
文件数:504030
SHA256:7D6935B1C63FF2F6BCABDD024EBC2A770F90C43B0D57B646FA7CBD4C0ABCF846
第11数据集:
magnet:?xt=urn:btih:59975667f8bdd5baf9945b0e2db8a57d52d32957&dn=DataSet%2011.zip
大小:25.557 GiB
文件数:331661
SHA1:574950c0f86765e897268834ac6ef38b370cad2a
需要添加 trackers 的话参考:
https://github.com/XIU2/TrackersListCollection
https://github.com/ngosang/trackerslist
第9数据集因为没有完整的压缩包,所以无法确认实际情况,我先尝试下把不完整的压缩包下载下来看下情况。
另外,根据 nyt 的报道,新公开的这些文件里,有40张没有打上大黑块、能够看到脸的没穿衣服的女性的照片,但无法确认是否是未成年,然后就把这事跟美国司法部说了,于是司法部把压缩包的链接给撤掉了……
--------------------分割线--------------------
2月3日最后的更新:
今天把第9数据集的情况给理清楚了。
结合各方情报,能够确认第9数据集总共有 531307 个 PDF 文件,再加上其他文件(比如说 mp4 avi 之类的),最后可能包含的文件总数是 533786 个。
分享最新的这些下载链接文本,之前分享的可以不用看了:
https://wwamp.lanzouu.com/ipTgP3how0re
因为美国司法部仍然还在移除文件,所以即使有这些下载链接,也会遇到部分文件无法下载的情况。
也有已经打包好了的下载,但是不是完整的,需要结合下载列表查漏补缺
49 GiB 的不完整的压缩包,包含已经被司法部移除的文件:
magnet:?xt=urn:btih:0a3d4b84a77bd982c9c2761f40944402b94f9c64&dn=DataSet9-incomplete.zip
45.63 GiB + 86.74 GiB 再去重得到的 96.25 GiB 的压缩包,这个是最接近完整的压缩包,有漏的文件还是结合下载列表查漏补缺:
magnet:?xt=urn:btih:7ac8f771678d19c75a26ea6c14e7d4c003fbf9b6&dn=dataset9-more-complete.tar.zst
最后还是提个醒,原始的第9、第10数据集里可能会有未成年的没穿衣服的照片,谨慎下载。 感谢楼主,不过我就不下载了,怕看吐了。 我直接看合订本 加鹅,加鹅 九成的图片就是普通照片,和他老婆合影,家具,猫,旅游之类的照片 我刚才看到那个厨房追没有手臂幼女的视频瞎到哭出来了……太恐怖了 今天把第9数据集的情况也搞定了,应该是最接近完整的了 感谢大佬帮助 希望有人用大模型跑完
将其中涉及到的国内名人列出来 话说说这个文件现在这个时间点能放出来是为什么
是因为快到中期选举、所以涉及**和美国深层政府的斗争吗 ? 勿徊哉 发表于 2026-2-4 06:40
希望有人用大模型跑完
将其中涉及到的国内名人列出来
有也大概率只会在餐桌上,不会在餐桌边吧。 https://www.jmail.world/ 补充一个邮箱,有人把邮件拿出来做成了gmail的形式,更方便大家查看,样子如图所示,而且其中不光有邮件,还有照片,行程,文件,短信,亚马逊购买记录,facebook页面以及对照片的VR演示,甚至还接入了AI,用以上资料做了数据库方便人来提问 勿徊哉 发表于 2026-2-4 06:50
话说说这个文件现在这个时间点能放出来是为什么
是因为快到中期选举、所以涉及**和美国深层政府的斗争吗 ? ...
随着美国以色列的老盟友开始有接近老中的迹象
要拉紧这些欧美上层的狗绳
告诉他们,随时都可以让你身败名裂,不想被爆,就赶紧想想自己该干点什么
他们的渗透已经很久了,即使最高领导人在他们手上没把柄,他们身边的人,他们国家的财阀,也会各种使劲的.
也有人认为
这个是打开窗户说亮话,不藏着掖着了,
警告对他们不友好的势力,后面做的事情将无任何底线,什么都可能发生
要明确站队
https://www.youtube.com/watch?v=qOk6uqIL9eY 很好奇,是谁把掌管百官行述的“”刁光斗“给扯下来的 iantsai 发表于 2026-2-4 08:11
有也大概率只会在餐桌上,不会在餐桌边吧。
已知提到麻风侏儒了,许皮带似乎也是他们的人 各个媒体上的某些群体已经应激了,这两天疯狂洗:“⏰不也一样烂!?”,就不说这张口就来的洗地姿势,曾几何时的地上神国人类灯塔,变成需要比烂式的洗地了。 蓝极北 发表于 2026-2-4 08:18
https://www.jmail.world/ 补充一个邮箱,有人把邮件拿出来做成了gmail的形式,更方便大家查看,样子如图所 ...
昨天玩了一下这个,挺逗的 加个鹅支持下就当下载了,不敢看 几十万个文件 这还只是公开的一部分
爱博斯坦从他起势到被捕也就20年 7000天 这家伙每天要干多少事啊
—— 来自 HUAWEI LIO-AN00, Android 12, 鹅球 v3.5.99 这不就有吗 ls转的这个也是人才,总是能角度新奇的洗地方式
这真没敢下,也太多了,慢慢等其他人爆料吧
页:
[1]