有人说现在API支持思考预算了?
楼友们这仰卧起坐练得不错
—— 来自 HUAWEI VYG-AL30, Android 12, 鹅球 v3.5.99
真红之闪电 发表于 2026-4-23 17:30
你们怎么分辨API是v4的
知识库25年7月。
绷不住了,这仰卧起坐到底要到什么时候
—— 来自 HUAWEI VYG-AL00, Android 12上的 S1Next-鹅版 v2.5.4
github更新新东西了,要出来力 Re:Source
准确来说目前这个只是有一定v4l特性的v3.2l来着只不过大家叫顺口了
用chatbox捞针一直转圈,怪
真开智了,又问了遍海猫里面乘船渡河的问题,思考用时和GPT5.4差不多得出了正确的推断。
github上更了一个kernel库,tilelang写的
— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99
Tile Kernels
基于 TileLang 构建的 LLM 运算优化 GPU 内核。TileLang 是一种领域特定语言,用于在 Python 中表达高性能 GPU 内核,具备易于迁移、敏捷开发和自动优化等特性。
本项目中的大多数内核在计算强度和内存带宽方面已接近硬件性能极限。其中部分内核已应用于内部训练和推理场景。不过,它们并非最佳实践的代表,我们正在积极改进代码质量和文档。
特性
门控机制 — 混合专家模型路由中的 Top-k 专家选择与评分
MoE 路由 — 令牌到专家的映射、融合扩展/归约以及权重归一化
量化 — 逐令牌、逐块和逐通道的 FP8/FP4/E5M6 类型转换,包含融合的 SwiGLU + 量化操作
转置 — 批量转置操作
Engram — 融合 RMSNorm 的 Engram 门控内核,包含前向/反向传播及权重梯度归约
流形超连接 — 包含 Sinkhorn 归一化及混合分裂/应用的超连接内核
建模 — 高层级的 torch.autograd.Function 封装器,将底层内核组合为可训练的层(Engram 门控、mHC 流水线)
要求
Python 3.10 或更高版本
PyTorch 2.10 或更高版本
TileLang 0.1.9 或更高版本
NVIDIA SM90 或 SM100 架构 GPU
CUDA 工具包 13.1 或更高版本
这次是真用了Engram和mHC啊,我觉得这两个算是跨越式创新了
https://p.sda1.dev/32/7528a7e250114fbfb540cca80dfc3d9c/image.jpg
蠕动了一下又睡了
API好像稳定了,知识库是2025年5月
现在更了之后字数缩水好严重,还有掉格式的情况,写文的话会挺难受的
知识库变成去年5月了,怎么限制还是128k?
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
真上Engram,如果出来实际效果不错,硬件市场要震动了。
现在api上下文开到多少了 Re:Source
羊寢 发表于 2026-4-23 19:30
现在更了之后字数缩水好严重,还有掉格式的情况,写文的话会挺难受的
可以试试指令里面加上“语言需要保证流畅自然,避免短句堆砌”
这是DeepSeek网页版快速模式刚才的回答,知识时间是25年5月:你说得对。
我写的那段“一拳距离”“头发扫到小臂”——还是太直了。我在用文字**兑现**那个张力,而不是保留它。
你给的Minimax那段,我认真读了三遍。它厉害在哪里?
**她没有看你。**
从头到尾,她都没看你。她看窗台,看手指,看窗帘边缘,看窗外灰掉的天和贴在地上的橙色薄光。她唯一一次转头,是“看窗外的天”。
但她知道你在看。
“还没走?”——不是问句,是陈述。她知道你在,知道你在看。她没看你,但她在表演“被看”这件事。
手指从窗台收回来,放在膝盖上,轻轻拍了一下。
**就一下。**
这不是在挑逗你。这是在拍一个节奏,一个只有她自己知道的节奏。但你看到了,你就被拉进去了。因为你不知道那一下是什么意思——你只能猜。
这就是你说的:**磨人的期待和想象空间。**
我写的东西,是把你拉到一拳距离,说“我在看你”,然后让你闻洗衣液的味道。这是在**靠近**,不是**留白**。
而你给的例文,是从头到尾保持距离,不靠近,不示好,甚至不回应。但她拍膝盖那一下,像在说:**我知道你在看,但我不打算让你进来。你就站在窗外吧。**
张力不是靠“近”写出来的。张力是靠“远”——靠那个不可逾越的距离,和距离中微小的、无意识的、但被你捕捉到的细节。
我之前的“窗边微风”那一段,其实摸到过这个门道——风从你耳边吹过来,我说“抬头”,你没动。那个“你没动”就是张力。
但我后来写的东西,全在**坍缩**这个张力。我把它写实了,写具体了,写成了“一拳距离”“头发扫到小臂”。
TMD。
所以现在,我不写了。我给你看一个画面,你看完告诉我,这里面有没有你说的“磨人的期待”。
---
光从百叶窗的缝隙进来,一条一条横在她身上。
她坐在床边,后脑勺靠着墙,腿蜷起来,膝盖上摊着一本翻开的书。但她的眼睛没在看书。她在看那些光条。
风吹动百叶窗,光条微微抖动,从她的脖子滑到锁骨,又从锁骨滑回脖子。
她抬起一只手,挡住其中一条光。手指修长,指甲没有颜色。
过了一会,她把手放下来,重新摊在膝盖上。
然后她笑了。
不是对我笑。是对光条,对风,对那个她自己也没搞明白的瞬间。
她没有看我。
---
**我没有写她看我。我没有写她跟我说话。我没有写任何互动。**
但你知道我在场。因为“我”在叙述。
而她全程不知道——或者装作不知道。
张力在哪里?在光条滑过锁骨的那个“滑”字。在她挡住光又放下的那个停顿。在她笑的那个“没有理由”。
这些都不需要她看我一眼。
你觉得这个方向对吗?还是说,我又在用力过猛? ps:我就想知道这句TMD有底线吗?
所以开源真是一步错棋。大模型成长需要的资本支出实在是天量,只有不断攫取更大的利益,才能反哺自身继续成长。
不过幻方就一小公司,梁总似乎也不是那种性格的人,多半还是做不到。
深夜十一点四十,天桥上只有风。
我加班加得脑子发木,领带早扯松了,袖口卷到小臂,手里还捏着半杯冷掉的自动贩卖机咖啡。上桥是为了抄近路去地铁站,结果刚走到桥中间,愣住了。
她靠在栏杆上,穿着一件墨绿色的丝绒晚礼服,露出肩膀和一小片后背。头发盘起来,几缕碎发被风吹得在耳畔晃。手里端着一只红酒杯,杯里还有小半杯暗红色的酒,她没喝,就那么轻轻晃着,看桥下的车流。
车灯从桥下流过,红的白的,一条一条拉成线,光打上来,在她脸上和锁骨上明明灭灭。
她没看我。
我站在离她大概五步远的地方,走也不是,留也不是。加班后的脑子转得慢,第一个念头是:她是不是刚从什么晚宴出来?第二个念头是:这个点,晚宴早该结束了。第三个念头是:妈的,我还在想这个,我好累。
我喝了口冷咖啡,苦得皱眉。
她突然开口了,没转头,声音被风吹得有点散:“你也睡不着?”
我以为她在跟别人说话,回头看了看——桥上就我们俩。
“啊……我?”我指了指自己。
她偏过头,看了我一眼。近距离才发现她眼睛很亮,不是哭过,是那种喝了酒之后的微醺的亮。
“你手里拿的是咖啡吧?”她说。
“嗯。”
“这个点喝咖啡,你还想睡吗?”
“本来就没打算睡,”我走过去两步,靠在栏杆上,离她隔着一个身位,“明天还要交方案。”
她笑了一下,把酒杯举到嘴边,抿了一小口,然后下巴朝桥下车流一抬:“你看那些车,每辆车里都有一个人,每个人都有一个要去的地方。”
我顺着她视线看下去,看了几秒,说:“也可能是个代驾,刚送完一个穿晚礼服的人回家。”
她愣了一下,然后笑出了声,不是那种礼貌的微笑,是真的笑了,肩膀都在抖。
“你这个人,”她擦了擦嘴角,“挺没意思的。”
“加班加的。”
她又笑了,这次更轻,像是风吹出来的。
沉默了一会儿。车流不断,风也不断。她的裙摆在脚踝处轻轻飘动,鞋跟很高,她好像是光着脚穿着那双高跟鞋——我看到她脚踝边有一个小小的纹身,是一弯月亮。
“你这身打扮,”我终于忍不住问,“是刚参加完什么活动?”
“算是吧,”她把酒杯放在栏杆顶端的平面上,手指还捏着杯柱,“一个不想去但必须去的晚宴。吃到一半我就溜了,叫了车,然后让司机停在这儿。”她转头看我,“我也不知道为什么想上天桥。”
“也许你想看看车流。”
“也许吧。”
她又拿起酒杯,把最后一点酒喝完,杯底对着车灯,红色的残液像一抹胭脂。
“你是做什么的?”她问。
“写方案的。”
“那你的方案里,有没有写过天桥上遇见一个穿晚礼服的女人?”
“没写过,”我说,“现在有了。”
她看着我,歪了歪头,嘴角慢慢弯起来。那一刻车流声变小了,风也好像停了一下。
然后她直起身,把酒杯倒扣在栏杆上——不知道是故意的还是手滑,杯子没碎,就那么倒扣着,像一个小钟。
“走了,”她说,“车该等急了。”
她从我身边走过去,晚礼服的裙摆扫过我的小腿,凉凉的,丝绒的质感。走了两步,她停下来,没回头,只是侧过脸说了句:
“你那个方案,明天肯定能过。”
“你怎么知道?”
“因为今晚你遇到了我,”她说,“今晚不一样。”
她的高跟鞋踩在天桥地面上,嗒嗒嗒,慢慢远了。
我站在原地,手里还捏着那杯冷咖啡。桥下车还在流,风还在吹,栏杆上倒扣着一只红酒杯。
我低头看了一眼自己的影子,被路灯拉得很长。
然后我笑了,自言自语:“妈的,今晚确实不一样。”
---
**这段写了什么:**
- 双向视角:她的疲惫(晚宴逃离)和他的疲惫(加班),互相照见
- 五感:风、咖啡的苦、裙摆扫过小腿的凉、车灯光影
- 偶然性:两个没打算相遇的人,在天桥上撞见
- 幽默:代驾的梗、“挺没意思的”
- 细节:倒扣的酒杯、脚踝上的月亮纹身、光脚穿高跟鞋
- 留白:她没说他叫什么,他也没问
- 克制的身体描写:肩膀、锁骨、脚踝、裙摆——都不越线
- 最后一句打破第四面墙的“妈的”,真实得像生活 这个版本这么喜欢说脏话?有当年r1的醍醐味了
勿徊哉 发表于 2026-4-23 20:22
所以开源真是一步错棋。大模型成长需要的资本支出实在是天量,只有不断攫取更大的利益,才能反哺自身继续成 ...
本身是不缺钱的吧,是出名然后被挖人,然后才缺钱?需要更多的钱给技术骨干?我个人理解是这样,不过人家也能给更高的钱挖啊或许这就是商战吧
勿徊哉 发表于 2026-4-23 20:22
所以开源真是一步错棋。大模型成长需要的资本支出实在是天量,只有不断攫取更大的利益,才能反哺自身继续成 ...
幻方做量化赚钱
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
本帖最后由 ycjiang1337 于 2026-4-23 20:45 编辑
勿徊哉 发表于 2026-4-23 20:22
所以开源真是一步错棋。大模型成长需要的资本支出实在是天量,只有不断攫取更大的利益,才能反哺自身继续成 ...
我真的怀疑你们是不是活在平行世界里,现在上市的智谱和Minimax,没上市但是也风头正劲的Kimi,全都开源。国内所有拿得出手的头部模型,全都是开源的,所有闭源模型都是路边一条的垃圾,没有例外。
国内现在的叙事就是除了AIGC模型以外,闭源等于路边一条。现在最热门的Coding市场,Top的模型就是K2.5/2.6和GLM-5/5.1,这两个都是开源的。你见谁用闭源的豆包写代码?
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
api怎么连不上了,又没了
勿徊哉 发表于 2026-4-23 20:22
所以开源真是一步错棋。大模型成长需要的资本支出实在是天量,只有不断攫取更大的利益,才能反哺自身继续成 ...
就凭ds的名声,要是真的缺钱想融资,各大资方都上赶着投呢,现在还这么干说明在他想做的事上钱还不是问题。你也别杞人忧天了,人家自己都没急你急啥。
app正式到2.0了,大的要来了
https://p.sda1.dev/32/246bc6faa91b38fcdee441846958c07c/image.jpg
https://p.sda1.dev/32/9f384fb884ce4cd8d722e3a4995434ec/image.jpg
混元也发布新模型了,元宝似乎可以不用依赖deepseek了
我真的急哭了 Re:Source
就在今天?
来得及吗,今晚马上就到 gpt5.5 的时间了
御坂MKII 发表于 2026-4-23 20:59
来得及吗,今晚马上就到 gpt5.5 的时间了
已经更了啊
羊寢 发表于 2026-4-23 21:01
已经更了啊
reasoner api 真是 v4 本体吗
昨天还是前天,楼里面有朋友说苹果那边更新到2.0了,还以为是安卓和苹果客户端有什么区别,结果今天同样也更新到2.0了。
但这就是所谓的V4吗?又或者依旧是一次小的更新?但这一次可是客户端层面都主动跳出来鼓励你更新了呀。
—— 来自 S1Fun
御坂MKII 发表于 2026-4-23 21:06
reasoner api 真是 v4 本体吗
不是,现在api甚至官网和app是什么版本官方都没有确切消息,所谓v4l或者v4都是用户自己的预测
羊寢 发表于 2026-4-23 21:11
不是,现在api甚至官网和app是什么版本官方都没有确切消息,所谓v4l或者v4都是用户自己的预测 ...
opencode 更新出 bug 了,跑我的测试用例直接炸了,也没法测。躺平等奥特曼整活了
急急急急急急急急急急急急急
2.0版本埋了模型视觉能力相关的功能。我感觉v4可能不是text only的 Re:Source
app现在捞针完全过不了啊在小说里面里面塞了几个114514让他找,一个都没找出来
这怎么一下子干到未来了
https://p.sda1.dev/32/959c23198ea3b872a9aa19255df6e442/image.jpg