硅谷101新节目讲meta ai如何滑铁卢的，把刚失业业半个月的田渊栋拉来采访了

itsmyrailgun 发表于 2025-11-9 17:36

本帖最后由 itsmyrailgun 于 2025-11-9 17:45 编辑

make llama great again！
省流：deepseek发布冲击和llama4翻车后，紧急掉田渊栋的fair的前沿研究团队救火，最后救火也没成功，裁员600人连救火队长都被裁掉了。
一想到小扎花了150亿美元收购+挖角来alex wang掌管meta的ai业务，我就感觉难绷啊。。。。

【失衡的乌托邦：Meta的开源AI路线是如何遭遇滑铁卢的【硅谷101】-哔哩哔哩】 https://b23.tv/iU8Mwis

视频简介：
2025年10月底，Meta AI部门宣布裁员600个职位，甚至核心部门的研究总监，同时掌管AI业务的高管纷纷离职、被边缘化，就连图灵奖得主Yann LeCun也被认为自身难保。Meta的此举非常割裂：一方面扎克伯格用上亿美元挖人，另一方面又大举裁员，背后的原因究竟是什么？
本期视频我们采访了Meta前FAIR研究总监田渊栋和参与Llama 3后训练的工程师Gavin Wang，试图还原Meta开源路线失败的根源。从2013年Yann LeCun加入Meta组建FAIR实验室开始，Llama系列一度成为开发者社区的骄傲。但在Llama 3成功后，高层急于产品化，忽视了FAIR在思维链等前沿技术的探索。而DeepSeek和OpenAI o1的推理冲击导致Meta内部混乱，临时抽调FAIR团队“救火” ，但最终还是在产品化压力下导致技术失衡，项目最终崩盘。
一个乌托邦式的AI实验室为何会沦为商业化的牺牲品？这场由Llama 4失败引发的大重组，是Meta AI的最后机会吗？

saizeriya 发表于 2025-11-9 17:42

Instagram是2012年买的，Whats App是2014年买的，从此以后扎克伯格还有再推出什么成功产品吗？

jojog 发表于 2025-11-9 17:54

主要营收不是已经变成小广告和ai电诈了么

感觉这150亿估计也不够烧的

qratosones1337 发表于 2025-11-9 18:46

整个视频从头到尾没提Qwen……

罗莉控 发表于 2025-11-9 18:51

qratosones1337 发表于 2025-11-9 18:46
整个视频从头到尾没提Qwen……

deepseek也提的尽量少了。觉得小札破防主要还是deepseek。llma比不过gpt正常，谁也没指望他们比得过

orecheng 发表于 2025-11-9 18:53

qratosones1337 发表于 2025-11-9 19:04

罗莉控发表于 2025-11-9 18:51
deepseek也提的尽量少了。觉得小札破防主要还是deepseek。llma比不过gpt正常，谁也没指望他们比得过 ...

这不就纯自嗨么，Qwen2.5在24年下半年已经开始逐渐占据上风了

罗莉控 发表于 2025-11-9 19:06

qratosones1337 发表于 2025-11-9 19:04
这不就纯自嗨么，Qwen2.5在24年下半年已经开始逐渐占据上风了

meta的大乱是三四月就开始的，那时候Qwen还比不上deepseek吧

qratosones1337 发表于 2025-11-9 19:10

罗莉控发表于 2025-11-9 19:06
meta的大乱是三四月就开始的，那时候Qwen还比不上deepseek吧
Llama从来都没摸到过SOTA的边，Qwen能不能比得上DeepSeek跟Llama又有什么关系？从任何角度来看Qwen都是Llama的直接竞对，到下半年Qwen2.5-72B已经跟Llama3-405B差不多了

sinomonster 发表于 2025-11-9 19:53

汪滔现在权势这么大啊...

diohanmilton 发表于 2025-11-9 19:59

说起来现在ai的底层基础pytorch是meta做出来的。上面的应用反而做的不行。

现在感觉国内反而开源多，deepseek，kimi，qwen。

外面的大头都是闭源，gpt gemini。

—— 来自 HONOR PGT-AN10, Android 15, 鹅球 v3.5.99-alpha

kumh 发表于 2025-11-9 20:06

kojima34 发表于 2025-11-9 20:15

keamedes 发表于 2025-11-9 21:25

kojima34 发表于 2025-11-9 20:15
国内的开源是开权，只分享权重不分享代码。PyTorch这种开发维护都很费时间金钱真开源却也赚不到钱的开源 ...

模型的代码其实没啥意义，数据和训练过程更重要。本质上模型不是软件，一锤子买卖的东西，不存在复现的价值。
现在ai领域的开源集中在推理引擎，这部分基本是国人主导。

yeo 发表于 2025-11-9 21:37

实际上大模型训练已经不是简单的代码问题，而是工程问题

模型训练其实是将原材料加工成产品的工业。数据收集、清洗，模型预训练后训练，最后产品就是模型权重。开放权重和搜索引擎免费用差不多

真田源次郎信繁 发表于 2025-11-9 21:39

其实仔细想想，meta从一开始就只在llama3辉煌过一次，说不定只是侥幸而已
llama其实和开源的GLM差不多水平，甚至还不如，llama2一样是CJB
只不过llama和llama2被学术界默认当成了baseline而已
llama3很强，当时我觉得Qwen2也就是刷榜比llama3强，实际没那么好使，但是后来DeepSeek-R1出来的时候我也试过用蒸馏的数据微调开源模型
确实和论文里一样，Qwen系刷题不是白刷的，用AIME的长思维链的题就是只有Qwen可以，llama3完全不行
而llama4只是回到llama2时代的CJB而已，而Qwen分分钟做出来QwQ确实是人家有积累

d2loader 发表于 2025-11-9 21:45

断舍离 发表于 2025-11-9 22:00

田渊栋是硅谷101老嘉宾了

kojima34 发表于 2025-11-9 22:11

oyss 发表于 2025-11-9 22:27

不得不佩服小扎家底厚啊.

折腾这么多年了,公司还活的好好的.

紧那罗 发表于 2025-11-9 22:45

kojima34 发表于 2025-11-9 22:11
说的就是数据和训练细节（实验参数）的代码啊，以前通常还是会至少放出用的数据集的。模型结构的技巧倒是 ...

你是我见过第二个质疑开源模型为什么没有放数据的。真不知道你们怎么能想出这么离谱的想法

且不说模型训练里用了多少有侵权嫌疑的灰色数据，哪怕是有授权的数据，难道模型开发者就有权利把这些数据公开出来吗

Vincent_law 发表于 2025-11-10 07:41

有鱼发表于 2025-11-10 07:49

astkaasa 发表于 2025-11-10 08:03

有鱼发表于 2025-11-10 07:49
光ds愿意把r1怎么实现cot的细节公开就算是实打实的开源了吧
ds还发了一堆论文来讲他们的思路
还是说只有洋 ...

那能一样么

洛拉斯 发表于 2025-11-10 08:07

kojima34 发表于 2025-11-9 20:15
国内的开源是开权，只分享权重不分享代码。PyTorch这种开发维护都很费时间金钱真开源却也赚不到钱的开源 ...

你所谓的开源是要求可以根据代码和语料自己手搓一个Deepseek才叫开源吗？

sellboy 发表于 2025-11-10 08:56

有鱼发表于 2025-11-10 07:49
光ds愿意把r1怎么实现cot的细节公开就算是实打实的开源了吧
ds还发了一堆论文来讲他们的思路
还是说只有洋 ...

一般来说开放权重就是开源了，就像开源软件不需要解释怎么画图标。

木水风铃 发表于 2025-11-10 09:02

这么一说想起来，阿里达摩院如何了？

—— 来自鹅球 v3.3.96

sellboy 发表于 2025-11-10 09:12

木水风铃发表于 2025-11-10 09:02
这么一说想起来，阿里达摩院如何了？

—— 来自鹅球 v3.3.96

qwen2.5开始就接过了llama3的位置成为了绝大部分二次开发模型的底模。

d2loader 发表于 2025-11-10 09:35

Vzero 发表于 2025-11-10 09:49

扎克伯这辈子只会并购已有的成功产品

cmdycj0732 发表于 2025-11-10 10:11

真田源次郎信繁发表于 2025-11-9 21:39
其实仔细想想，meta从一开始就只在llama3辉煌过一次，说不定只是侥幸而已
llama其实和开源的GLM差不多水平 ...

Qwen2确实一般，2.5才开始全面占据上风

—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha

cmdycj0732 发表于 2025-11-10 10:13

本帖最后由 cmdycj0732 于 2025-11-10 10:15 编辑

木水风铃发表于 2025-11-10 09:02
这么一说想起来，阿里达摩院如何了？

—— 来自鹅球 v3.3.96

Qwen2.5在24年下半年就已经取得了对Llama3系列的全面优势，目前杭州双雄都是全球第一梯队的模型，哪怕不只限于开源。然后只看中小尺寸模型的话，llama烂完之后Qwen3现在是唯一的霸主

—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha

cmdycj0732 发表于 2025-11-10 10:23

llama组最离谱的是技术储备极度贫瘠——连MoE这么重要的技术都没储备，等DeepSeek出来之后才发现自己的模型结构都错的离谱

—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha

我来组成头部 发表于 2025-11-10 10:34

蜥蜴人又不是靠技术起家的，人家资本化后跟鱿畜绑死左脚踩右脚原地飞升，这种来钱太快你要他搞技术，人家有过吗

—— 来自 S1Fun

RJG丶one 发表于 2025-11-10 10:56

所以现在对meta的定义就是美国腾讯？

sellboy 发表于 2025-11-10 10:58

RJG丶one 发表于 2025-11-10 10:56
所以现在对meta的定义就是美国腾讯？

美国百度

一骑当千 发表于 2025-11-10 10:58

RJG丶one 发表于 2025-11-10 10:56
所以现在对meta的定义就是美国腾讯？

乳腾讯了，就一百度水准。

—— 来自 HONOR ALP-AN00, Android 14, 鹅球 v3.5.99

不见不散 发表于 2025-11-10 10:59

之前的源宇宙项目的内部绰号是“哄扎乐”（MZH，make Zuckerberg happy），我看这ai不过是新的哄扎乐罢了

卡普空 发表于 2025-11-10 11:05

现在感觉就是开源模型越来越强，闭源模型不知道还能撑几天

oldttt 发表于 2025-11-10 13:40

本帖最后由 oldttt 于 2025-11-10 13:42 编辑

alex wang上位确实让人有点绷不住也可能我没眼光但我的旁观感受就是魏忠贤掌权

—— 来自 S1Fun

页: [1] 2

Stage1st's Archiver

硅谷101新节目讲meta ai如何滑铁卢的，把刚失业业半个月的田渊栋拉来采访了