硅谷101新节目讲meta ai如何滑铁卢的,把刚失业业半个月的田渊栋拉来采访了
本帖最后由 itsmyrailgun 于 2025-11-9 17:45 编辑make llama great again!
省流:deepseek发布冲击和llama4翻车后,紧急掉田渊栋的fair的前沿研究团队救火,最后救火也没成功,裁员600人连救火队长都被裁掉了。
一想到小扎花了150亿美元收购+挖角来alex wang掌管meta的ai业务,我就感觉难绷啊。。。。
【失衡的乌托邦:Meta的开源AI路线是如何遭遇滑铁卢的【硅谷101】-哔哩哔哩】 https://b23.tv/iU8Mwis
视频简介:
2025年10月底,Meta AI部门宣布裁员600个职位,甚至核心部门的研究总监,同时掌管AI业务的高管纷纷离职、被边缘化,就连图灵奖得主Yann LeCun也被认为自身难保。Meta的此举非常割裂:一方面扎克伯格用上亿美元挖人,另一方面又大举裁员,背后的原因究竟是什么?
本期视频我们采访了Meta前FAIR研究总监田渊栋和参与Llama 3后训练的工程师Gavin Wang,试图还原Meta开源路线失败的根源。从2013年Yann LeCun加入Meta组建FAIR实验室开始,Llama系列一度成为开发者社区的骄傲。但在Llama 3成功后,高层急于产品化,忽视了FAIR在思维链等前沿技术的探索。而DeepSeek和OpenAI o1的推理冲击导致Meta内部混乱,临时抽调FAIR团队“救火” ,但最终还是在产品化压力下导致技术失衡,项目最终崩盘。
一个乌托邦式的AI实验室为何会沦为商业化的牺牲品?这场由Llama 4失败引发的大重组,是Meta AI的最后机会吗? Instagram是2012年买的,Whats App是2014年买的,从此以后扎克伯格还有再推出什么成功产品吗? 主要营收不是已经变成小广告和ai电诈了么
感觉这150亿估计也不够烧的 整个视频从头到尾没提Qwen…… qratosones1337 发表于 2025-11-9 18:46
整个视频从头到尾没提Qwen……
deepseek也提的尽量少了。觉得小札破防主要还是deepseek。llma比不过gpt正常,谁也没指望他们比得过 罗莉控 发表于 2025-11-9 18:51
deepseek也提的尽量少了。觉得小札破防主要还是deepseek。llma比不过gpt正常,谁也没指望他们比得过 ...
这不就纯自嗨么,Qwen2.5在24年下半年已经开始逐渐占据上风了
qratosones1337 发表于 2025-11-9 19:04
这不就纯自嗨么,Qwen2.5在24年下半年已经开始逐渐占据上风了
meta的大乱是三四月就开始的,那时候Qwen还比不上deepseek吧 罗莉控 发表于 2025-11-9 19:06
meta的大乱是三四月就开始的,那时候Qwen还比不上deepseek吧
Llama从来都没摸到过SOTA的边,Qwen能不能比得上DeepSeek跟Llama又有什么关系?从任何角度来看Qwen都是Llama的直接竞对,到下半年Qwen2.5-72B已经跟Llama3-405B差不多了 汪滔现在权势这么大啊... 说起来现在ai的底层基础pytorch是meta做出来的。上面的应用反而做的不行。
现在感觉国内反而开源多,deepseek,kimi,qwen。
外面的大头都是闭源,gpt gemini。
—— 来自 HONOR PGT-AN10, Android 15, 鹅球 v3.5.99-alpha kojima34 发表于 2025-11-9 20:15
国内的开源是开权,只分享权重不分享代码。PyTorch这种开发维护都很费时间金钱真开源却也赚不到钱的开源 ...
模型的代码其实没啥意义,数据和训练过程更重要。本质上模型不是软件,一锤子买卖的东西,不存在复现的价值。
现在ai领域的开源集中在推理引擎,这部分基本是国人主导。 实际上大模型训练已经不是简单的代码问题,而是工程问题
模型训练其实是将原材料加工成产品的工业。数据收集、清洗,模型预训练后训练,最后产品就是模型权重。开放权重和搜索引擎免费用差不多 其实仔细想想,meta从一开始就只在llama3辉煌过一次,说不定只是侥幸而已
llama其实和开源的GLM差不多水平,甚至还不如,llama2一样是CJB
只不过llama和llama2被学术界默认当成了baseline而已
llama3很强,当时我觉得Qwen2也就是刷榜比llama3强,实际没那么好使,但是后来DeepSeek-R1出来的时候我也试过用蒸馏的数据微调开源模型
确实和论文里一样,Qwen系刷题不是白刷的,用AIME的长思维链的题就是只有Qwen可以,llama3完全不行
而llama4只是回到llama2时代的CJB而已,而Qwen分分钟做出来QwQ确实是人家有积累 田渊栋是硅谷101老嘉宾了 不得不佩服小扎家底厚啊.
折腾这么多年了,公司还活的好好的. kojima34 发表于 2025-11-9 22:11
说的就是数据和训练细节(实验参数)的代码啊,以前通常还是会至少放出用的数据集的。模型结构的技巧倒是 ...
你是我见过第二个质疑开源模型为什么没有放数据的。真不知道你们怎么能想出这么离谱的想法
且不说模型训练里用了多少有侵权嫌疑的灰色数据,哪怕是有授权的数据,难道模型开发者就有权利把这些数据公开出来吗 有鱼 发表于 2025-11-10 07:49
光ds愿意把r1怎么实现cot的细节公开就算是实打实的开源了吧
ds还发了一堆论文来讲他们的思路
还是说只有洋 ...
那能一样么 kojima34 发表于 2025-11-9 20:15
国内的开源是开权,只分享权重不分享代码。PyTorch这种开发维护都很费时间金钱真开源却也赚不到钱的开源 ...
你所谓的开源是要求可以根据代码和语料自己手搓一个Deepseek才叫开源吗? 有鱼 发表于 2025-11-10 07:49
光ds愿意把r1怎么实现cot的细节公开就算是实打实的开源了吧
ds还发了一堆论文来讲他们的思路
还是说只有洋 ...
一般来说开放权重就是开源了,就像开源软件不需要解释怎么画图标。 这么一说想起来,阿里达摩院如何了?
—— 来自 鹅球 v3.3.96 木水风铃 发表于 2025-11-10 09:02
这么一说想起来,阿里达摩院如何了?
—— 来自 鹅球 v3.3.96
qwen2.5开始就接过了llama3的位置成为了绝大部分二次开发模型的底模。 扎克伯这辈子只会并购已有的成功产品 真田源次郎信繁 发表于 2025-11-9 21:39
其实仔细想想,meta从一开始就只在llama3辉煌过一次,说不定只是侥幸而已
llama其实和开源的GLM差不多水平 ...
Qwen2确实一般,2.5才开始全面占据上风
—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha 本帖最后由 cmdycj0732 于 2025-11-10 10:15 编辑
木水风铃 发表于 2025-11-10 09:02
这么一说想起来,阿里达摩院如何了?
—— 来自 鹅球 v3.3.96
Qwen2.5在24年下半年就已经取得了对Llama3系列的全面优势,目前杭州双雄都是全球第一梯队的模型,哪怕不只限于开源。然后只看中小尺寸模型的话,llama烂完之后Qwen3现在是唯一的霸主
—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha llama组最离谱的是技术储备极度贫瘠——连MoE这么重要的技术都没储备,等DeepSeek出来之后才发现自己的模型结构都错的离谱
—— 来自 HUAWEI HBN-AL80, Android 12, 鹅球 v3.4.97-alpha 蜥蜴人又不是靠技术起家的,人家资本化后跟鱿畜绑死左脚踩右脚原地飞升,这种来钱太快你要他搞技术,人家有过吗
—— 来自 S1Fun 所以现在对meta的定义就是美国腾讯? RJG丶one 发表于 2025-11-10 10:56
所以现在对meta的定义就是美国腾讯?
美国百度 RJG丶one 发表于 2025-11-10 10:56
所以现在对meta的定义就是美国腾讯?
乳腾讯了,就一百度水准。
—— 来自 HONOR ALP-AN00, Android 14, 鹅球 v3.5.99 之前的源宇宙项目的内部绰号是“哄扎乐”(MZH,make Zuckerberg happy),我看这ai不过是新的哄扎乐罢了 现在感觉就是开源模型越来越强,闭源模型不知道还能撑几天 本帖最后由 oldttt 于 2025-11-10 13:42 编辑
alex wang上位确实让人有点绷不住 也可能我没眼光 但我的旁观感受就是魏忠贤掌权
—— 来自 S1Fun
页:
[1]
2