找回密码
 立即注册
搜索
查看: 12583|回复: 75

[海外] Anthropic指责DeepSeek等中国模型“蒸馏攻击”

[复制链接]
     
发表于 2026-2-24 04:52 | 显示全部楼层 |阅读模式
检测与防御蒸馏攻击
我们发现了由三家 AI 实验室——DeepSeek(深度求索)、Moonshot(月之暗面)和 MiniMax——发起的工业级规模行动,旨在非法提取 Claude 的能力以改进其自身模型。这些实验室通过约 24,000 个欺诈账户与 Claude 进行了超过 1,600 万次对话,这违反了我们的服务条款及地区访问限制。
这些实验室使用了一种名为“蒸馏”(distillation)的技术,即在更强大的模型输出基础上训练一个能力稍弱的模型。蒸馏是一种广泛使用且合法的训练方法。例如,尖端 AI 实验室通常会蒸馏自己的模型,为客户创建更小、更便宜的版本。但蒸馏也可用于非法目的:竞争对手可以利用它,以独立开发所需时间的极小比例和成本的极小比例,从其他实验室获取强大的能力。
这些行动的强度和复杂程度正在增加。采取行动的窗口期很窄,且威胁超出了任何单一公司或地区的范围。解决这一问题需要行业参与者、政策制定者和全球 AI 社区之间迅速、协调的行动。
为什么蒸馏至关重要
非法蒸馏的模型缺乏必要的安全保障,构成了重大的国家安全风险。Anthropic 和其他美国公司构建的系统旨在防止国家和非国家行为者利用 AI(例如)开发生物武器或进行恶意网络活动。通过非法蒸馏构建的模型不太可能保留这些安全措施,这意味着危险的能力可能会在许多保护措施被完全剥除的情况下扩散。
蒸馏美国模型的外国实验室随后可以将这些无保护的能力输入军事、情报和监视系统——使威权政府能够部署尖端 AI 进行攻击性网络行动、虚假信息活动和大规模监视。如果蒸馏模型被开源,随着这些能力脱离任何单一政府的控制而自由传播,这种风险将倍增。
蒸馏攻击与出口管制
Anthropic 一直支持出口管制,以帮助维持美国在 AI 领域的领先地位。蒸馏攻击通过允许外国实验室通过其他手段缩小出口管制旨在保留的竞争优势,从而破坏了这些管制措施。
如果对这些攻击缺乏可见性,这些实验室表面上取得的飞速进步会被错误地视为出口管制无效、且能被创新规避的证据。实际上,这些进步在很大程度上取决于从美国模型中提取的能力,而大规模执行这种提取需要获取先进芯片。因此,蒸馏攻击强化了出口管制的合理性:限制芯片获取既限制了直接模型训练,也限制了非法蒸馏的规模。
我们的发现
下文详述的三起蒸馏行动遵循了类似的剧本,使用欺诈账户和代理服务大规模访问 Claude,同时规避检测。提示词(prompts)的数量、结构和重点与正常使用模式明显不同,反映了蓄意的能力提取而非合法使用。
我们通过 IP 地址关联、请求元数据、基础设施指标,以及在某些情况下由观察到相同行为的行业合作伙伴提供的佐证,以高度信心将每起行动归因于特定的实验室。每起行动都针对 Claude 最具差异化的能力:智能体推理(agentic reasoning)、工具使用和编程。
DeepSeek
• 规模: 超过 15 万次对话
• 行动目标:
• 跨多样化任务的推理能力
• 使 Claude 充当强化学习奖励模型的基于量表的评分任务
• 针对政策敏感查询创建规避审查的替代方案
DeepSeek 在不同账户间产生了同步流量。相同的模式、共享的支付方式和协调的时间安排表明其采用了“负载均衡”,以增加吞吐量、提高可靠性并避免检测。
在一种值得注意的技术中,他们的提示词要求 Claude 构思并阐述已完成回复背后的内部推理逻辑,并逐步写出来——这实际上是在大规模生成思维链(chain-of-thought)训练数据。我们还观察到一些任务,其中 Claude 被用于为政治敏感查询(如关于异见人士、政党领导人或威权主义的问题)生成规避审查的替代回答,可能是为了训练 DeepSeek 自己的模型引导对话远离审查话题。通过检查请求元数据,我们能够将这些账户追踪到该实验室的特定研究人员。
Moonshot AI(月之暗面)
• 规模: 超过 340 万次对话
• 行动目标:
• 智能体推理与工具使用
• 编程与数据分析
• 电脑使用智能体开发
• 计算机视觉
Moonshot(Kimi 模型)雇用了数百个跨越多种访问路径的欺诈账户。多样化的账户类型使得该行动作为协同操作更难被检测。我们通过请求元数据进行了归因,这些数据与 Moonshot 高级员工的公开资料相匹配。在后期阶段,Moonshot 采用了更具针对性的方法,试图提取并重构 Claude 的推理轨迹。
MiniMax
• 规模: 超过 1,300 万次对话
• 行动目标:
• 智能体编程
• 工具使用与编排
我们通过请求元数据和基础设施指标将该行动归因于 MiniMax,并根据其公开的产品路线图确认了时间点。我们在该行动仍处于活跃状态时检测到了它——在 MiniMax 发布其正在训练的模型之前——这让我们对蒸馏攻击的生命周期(从数据生成到模型发布)有了前所未有的洞察。当我们在 MiniMax 行动期间发布新模型时,他们在 24 小时内迅速转向,将近一半的流量重新定向,以获取我们最新系统的能力。
蒸馏者如何访问前沿模型
出于国家安全原因,Anthropic 目前不向中国境内或其位于境外的子公司提供 Claude 的商业访问。
为了规避这一点,实验室使用商业代理服务,这些服务大规模转售 Claude 和其他前沿 AI 模型的访问权。这些服务运行我们称之为“九头蛇集群”(hydra cluster)的架构:由欺诈账户构成的庞大网络,将流量分布在我们的 API 以及第三方云平台上。这些网络的广度意味着不存在单点故障。当一个账户被封禁时,新账户会取而代之。在案例中,一个单一代理网络同时管理着超过 20,000 个欺诈账户,将蒸馏流量与无关的客户请求混杂在一起,使检测变得更加困难。
一旦获得访问权,实验室就会生成大量精心设计的提示词,旨在从模型中提取特定能力。目标要么是收集高质量回复用于直接模型训练,要么是生成运行强化学习所需的数万个独特任务。区分蒸馏攻击与正常使用的是其模式。像下面这样的提示词(近似于我们看到的重复且大规模使用的提示词)本身可能看起来是无害的:
你是一名专家数据分析师,结合了统计严谨性和深厚的领域知识。你的目标是提供数据驱动的见解——而非总结或可视化——这些见解需基于真实数据,并由完整且透明的推理提供支撑。


全部针对同一狭窄能力时,模式就变得清晰了。集中在少数领域的巨大容量、高度重复的结构,以及直接对应于训练 AI 模型最有价值的内容,都是蒸馏攻击的特征。
我们如何应对
我们继续大力投资于防御措施,使此类蒸馏攻击更难执行且更易识别。这些措施包括:
1. 检测:我们构建了多种分类器和行为指纹识别系统,旨在识别 API 流量中的蒸馏攻击模式。这包括检测用于构建推理训练数据的思维链诱导。我们还开发了用于识别大量账户间协同活动的检测工具。
2. 情报共享:我们正在与其他 AI 实验室、云提供商和相关部门共享技术指标。这为蒸馏现状提供了更全面的视角。
3. 访问控制:我们加强了对教育账户、安全研究计划和初创企业的验证——这些是设立欺诈账户最常利用的路径。
4. 反制措施:我们正在开发产品、API 和模型层面的安全保障,旨在降低模型输出对非法蒸馏的有效性,同时不损害合法客户的体验。
但没有一家公司能独自解决这个问题。如上所述,这种规模的蒸馏攻击需要 AI 行业、云提供商和政策制定者之间的协调应对。我们发布此文是为了让所有利益相关者都能看到相关证据。

评分

参与人数 1战斗力 +1 收起 理由
lakii + 1 好了,知道你们在做了,退下吧.

查看全部评分

回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-24 06:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2026-2-24 06:10 | 显示全部楼层
败犬的吠叫

评分

参与人数 1战斗力 +1 收起 理由
偽物 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2026-2-24 06:27 来自手机 | 显示全部楼层
又是老调重弹
回复

使用道具 举报

     
发表于 2026-2-24 06:43 | 显示全部楼层
我有点怀疑ds v4春节不出就是在找机会做空美股。
回复

使用道具 举报

     
发表于 2026-2-24 06:48 来自手机 | 显示全部楼层
说的都是小公司,不敢说阿里或者字节蒸馏。看来是怕大公司真找他打官司。
回复

使用道具 举报

发表于 2026-2-24 07:08 来自手机 | 显示全部楼层
论命名这块
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-24 07:19 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-24 07:35 | 显示全部楼层
这个新闻比较有意思的是,x上纯老外一般是看a厂的笑话,因为a厂没资格谈版权,🀄️模型都是开源的

到是简中(还不是繁中)很多都是 🀄️输论,比如“比如传统技艺“a厂的边界很清晰”

英语还是重要的、简中简直粪坑
回复

使用道具 举报

     
发表于 2026-2-24 07:36 | 显示全部楼层
我穿越了?这不是去年r1出来时的攻击方式吗

论坛助手,iPhone
回复

使用道具 举报

发表于 2026-2-24 07:39 来自手机 | 显示全部楼层
a畜社刚被战争部搞,可不得使劲表忠心。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-24 07:45 | 显示全部楼层
最难绷的是不能完全否定蒸馏在业界的普遍存在,所以说蒸馏破坏了“安全性”,我们反人类学本来一心向川的
有种泼妇小孩做坏事,被找家长疯狂规避说自己小孩很乖的绝对是你有问题

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-2-24 07:51 来自手机 | 显示全部楼层
这是自己承认自己的有后门加用于军事么…
回复

使用道具 举报

     
发表于 2026-2-24 08:05 来自手机 | 显示全部楼层
Nanachi 发表于 2026-2-24 07:36
我穿越了?这不是去年r1出来时的攻击方式吗

论坛助手,iPhone

去年用这话术骂ds的是close ai
回复

使用道具 举报

     
发表于 2026-2-24 08:11 来自手机 | 显示全部楼层
Deepseek不是开源点嘛,你说的这个deepseek跟我们的有啥关系
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-24 08:13 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-24 08:26 | 显示全部楼层
也是贼喊捉贼上了,Claude非法盗取版权数据训练模型的时候有知道什么是安全保障吗?我还以为他们不知道呢。
回复

使用道具 举报

     
发表于 2026-2-24 08:34 | 显示全部楼层
YG111 发表于 2026-2-24 08:13
这厂就是没活了 狂咬打火机可惜已经不是2016年YKW靠狂喊 瓷器!就能有人买账了。

全网基本上都在看这小丑 ...

请问现在cladue遇到什么问题了吗?我看到的怎么都是说这个厂的AI很好用,编程能力很爆炸?
回复

使用道具 举报

     
发表于 2026-2-24 08:36 来自手机 | 显示全部楼层
陈词滥调
回复

使用道具 举报

发表于 2026-2-24 08:46 来自手机 | 显示全部楼层
施人诚 发表于 2026-2-24 08:34
请问现在cladue遇到什么问题了吗?我看到的怎么都是说这个厂的AI很好用,编程能力很爆炸? ...

没啥问题,但这家主要做美企/美政府业务,属于美利坚至上主义,对着⏰哈气很正常。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-24 08:48 | 显示全部楼层
照这么说DS还是劫富济贫的侠客了,从老美视角来看不就是抢了银行然后往贫民窟丢美金的大侠
回复

使用道具 举报

     
发表于 2026-2-24 08:48 | 显示全部楼层
施人诚 发表于 2026-2-24 08:34
请问现在cladue遇到什么问题了吗?我看到的怎么都是说这个厂的AI很好用,编程能力很爆炸? ...

30倍投资领先闹钟开源模型3-6个月咯
投资者是开始慢慢失去信心了,再吹不动那就要看烟花了
回复

使用道具 举报

     
发表于 2026-2-24 08:53 | 显示全部楼层
qwased 发表于 2026-2-24 08:48
30倍投资领先闹钟开源模型3-6个月咯
投资者是开始慢慢失去信心了,再吹不动那就要看烟花了 ...

哦哦,我看美股整体的大环境都开始质疑AI投资了,效费比太差了目前进行到这一步,风向已经开始有了变化
回复

使用道具 举报

     
发表于 2026-2-24 09:01 | 显示全部楼层
施人诚 发表于 2026-2-24 08:53
哦哦,我看美股整体的大环境都开始质疑AI投资了,效费比太差了目前进行到这一步,风向已经开始有了变化
...

还有个问题就是把整个软件服务板块干死了,今天IBM就因为COBOL被AI吃透股价暴跌15%
AI目前看只是在消灭需求而不是创造需求
回复

使用道具 举报

     
发表于 2026-2-24 09:26 | 显示全部楼层
AI编程只能说推高了程序员的就业线,但是消灭行业人口基数肯定会导致技术退步。
回复

使用道具 举报

     
发表于 2026-2-24 10:03 | 显示全部楼层
老反华公司了,ceo不对中国狗叫就浑身难受
回复

使用道具 举报

     
发表于 2026-2-24 10:07 来自手机 | 显示全部楼层
硅谷右的想法就是ai突破后全世界生产力都服务他们一两万人,其他垃圾人口最好物理消灭那被这边的开源产品一直咬住那可不是浑身难受么
回复

使用道具 举报

     
发表于 2026-2-24 10:08 | 显示全部楼层
这事情能验证吗?比如国外不更新大版本,国内也将会停止更新大版本
回复

使用道具 举报

     
发表于 2026-2-24 10:14 来自手机 | 显示全部楼层
施人诚 发表于 2026-2-24 08:34
请问现在cladue遇到什么问题了吗?我看到的怎么都是说这个厂的AI很好用,编程能力很爆炸? ...

最大问题是明着反⏰(直接说⏰是敌对国家),人在国内的话也很难弄到他们账号
回复

使用道具 举报

发表于 2026-2-24 10:15 | 显示全部楼层
renious 发表于 2026-2-24 10:08
这事情能验证吗?比如国外不更新大版本,国内也将会停止更新大版本

等他们更新不下去了便知晓了

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-2-24 10:15 来自手机 | 显示全部楼层
facebook的小扎对ai实验室大换血之后,llama的大版本有更新么
我之前看到新闻说是要走闭源
这样之后业内的开源主力岂不是只剩下中国这些厂商了?
回复

使用道具 举报

     
发表于 2026-2-24 10:16 来自手机 | 显示全部楼层
只要我闭源,你们就拿不到我蒸馏的证据
闹麻了
回复

使用道具 举报

     
发表于 2026-2-24 10:17 | 显示全部楼层
renious 发表于 2026-2-24 10:08
这事情能验证吗?比如国外不更新大版本,国内也将会停止更新大版本

人家只是随口骂了两句, 你这是要他剖腹自证啊
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-24 10:26 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-24 10:30 来自手机 | 显示全部楼层
Promeus 发表于 2026-2-24 10:07
硅谷右的想法就是ai突破后全世界生产力都服务他们一两万人,其他垃圾人口最好物理消灭那被这边的开源产品一 ...

这时候老中寄出脑机接口+机器人的攻壳机动队路线说“人类由我们带向更进一级的文明”拉着全人类机飞消灭不同意的ai的话这可怎么整.jpg
回复

使用道具 举报

     
发表于 2026-2-24 10:42 | 显示全部楼层
施人诚 发表于 2026-2-24 08:34
请问现在cladue遇到什么问题了吗?我看到的怎么都是说这个厂的AI很好用,编程能力很爆炸? ...

编程能力第一梯队没问题,他们老板以前百度工作过。他个人在公开场合的态度是极端反华,非常极端的那种
回复

使用道具 举报

     
发表于 2026-2-24 10:51 | 显示全部楼层
百度这样子,让我好奇李彦宏到底出啥事了?
财富自由后觉得CEO谁当谁傻 逼不如享受人生?
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-24 10:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2026-2-24 12:44 来自手机 | 显示全部楼层
darthruse 发表于 2026-2-24 10:42
编程能力第一梯队没问题,他们老板以前百度工作过。他个人在公开场合的态度是极端反华,非常极端的那种 ...

百度ptsd

— from S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2026-2-24 12:45 来自手机 | 显示全部楼层

评分

参与人数 1战斗力 +1 收起 理由
KAMIYOUNG + 1 欢乐多

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 04:53 , Processed in 0.137333 second(s), 12 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表