找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
发表于 2026-4-29 16:37 | 显示全部楼层
多模态要效果理想的话,估计得从头重新训练吧
看v4世代能不能端出来旗舰级多模态模型了

论坛助手,iPhone
回复

使用道具 举报

发表于 2026-4-29 16:41 | 显示全部楼层
Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---

你这明显也不像它老板啊,而且梁圣在互联网上的照片可能就几张    Re:Source
回复

使用道具 举报

     
发表于 2026-4-29 16:53 | 显示全部楼层
Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---

感觉这图是没触发识图,只是OCR识别出文字了
回复

使用道具 举报

     
发表于 2026-4-29 16:55 | 显示全部楼层
目前看起来更像是外挂了一个识别tag的模型,并不是原生多模态,不过能解决有没有的问题也不错
回复

使用道具 举报

发表于 2026-4-29 17:15 | 显示全部楼层
怎么还没灰度到我,太慢了吧
回复

使用道具 举报

     
发表于 2026-4-29 17:18 | 显示全部楼层

原来我的头像是龙背上的破鞋吗

Re:Source · Xiaomi 15
回复

使用道具 举报

     
发表于 2026-4-29 17:21 来自手机 | 显示全部楼层
试了下,没问题,思考链是纯识别出来的

—— 来自 OPPO PLG110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-29 17:25 | 显示全部楼层
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗
回复

使用道具 举报

发表于 2026-4-29 17:27 | 显示全部楼层
只是翻译网页的话,肯定是用v4f,又便宜又快

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-29 17:28 来自手机 | 显示全部楼层
有鱼 发表于 2026-4-29 17:27
只是翻译网页的话,肯定是用v4f,又便宜又快

论坛助手,iPhone

不是v4f吗

评分

参与人数 1战斗力 +1 收起 理由
有鱼 + 1 typo

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-29 17:28 | 显示全部楼层
好像app已经推了,但我没有灰度到

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2026-4-29 17:29 | 显示全部楼层
hai

还真有了

论坛助手,iPhone

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2026-4-29 17:30 | 显示全部楼层
Onelooker 发表于 2026-4-29 17:25
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗

翻译很难命中缓存,也就是你就是硬吃正价    Re:Source
回复

使用道具 举报

     
发表于 2026-4-29 17:54 来自手机 | 显示全部楼层
现在识图进化到生图难不难?

—— 来自 HUAWEI ADY-AL10, Android 12, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-4-29 18:16 | 显示全部楼层
1224700457 发表于 2026-4-29 17:54
现在识图进化到生图难不难?

—— 来自 HUAWEI ADY-AL10, Android 12, 鹅球 v3.5.99-alpha ...

可以做,但是效果没法做到顶尖。
所以一般还是限定输出单模态的。openai也是这么搞的。这方面还欠一个先驱
回复

使用道具 举报

     
发表于 2026-4-29 18:36 | 显示全部楼层
没有被灰度到的人有难了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-29 18:38 来自手机 | 显示全部楼层
生图反而是真不急的,首先头部闭源image-2和香蕉真不贵,用量也没那么大,然后nsfw,本地因为硬件在那出品也不能指望立刻脱胎换骨,二次元nsfw还有线上的nai呢
回复

使用道具 举报

     
发表于 2026-4-29 18:58 | 显示全部楼层
deepseek提供视觉功能了也未必是传统实现方案的,到时候看论文,说不定那个路线是可以比较容易实现逆输出的。
回复

使用道具 举报

     
发表于 2026-4-29 19:03 | 显示全部楼层
OCR那个论文有说靠LLM本身的能力实现视觉,不知道是不是应用在这个上面
回复

使用道具 举报

     
发表于 2026-4-29 19:18 | 显示全部楼层
Onelooker 发表于 2026-4-29 17:25
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗

翻译的话用flash关thinking就好

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-29 19:19 | 显示全部楼层
已经开放使用了?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-29 19:26 | 显示全部楼层

灰度测试罢了,不是所有人都有,看了一下我自己的,就没有。

—— 来自 S1Fun
回复

使用道具 举报

发表于 2026-4-29 19:31 来自手机 | 显示全部楼层
本帖最后由 INDIASH 于 2026-4-29 19:35 编辑
Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---

左边的人: 东亚男性,戴眼镜,穿蓝色西装外套,打白色衬衫,面带自信、略带笑容的表情。这与梁文锋(DeepSeek的创始人兼CEO/实际领导者)的公开露面高度吻合。


拿1165楼里的图试了下,还是能识别出来的
应该是衣服问题
回复

使用道具 举报

     
发表于 2026-4-29 19:32 | 显示全部楼层
我也灰度到了,目前用起来还很猪比,可能和之前v4l灰度一样拿了个小模型测试
回复

使用道具 举报

     
发表于 2026-4-29 19:34 | 显示全部楼层
Nanachi 发表于 2026-4-29 19:18
翻译的话用flash关thinking就好

论坛助手,iPhone

thinking怎么关
回复

使用道具 举报

     
发表于 2026-4-29 19:35 来自手机 | 显示全部楼层
有个问题想问一下,现在的网页版快速模式和专家模式到底是啥模型?
感觉既没flash这么快又没pro这么聪明,专家和快速我好像也用不出什么差别。
回复

使用道具 举报

     
发表于 2026-4-29 19:41 | 显示全部楼层
serj005 发表于 2026-4-29 19:35
有个问题想问一下,现在的网页版快速模式和专家模式到底是啥模型?
感觉既没flash这么快又没pro这么聪明, ...

快速模式V4f-high
专家模式V4p-high
思维链比调用API开max短一些。
回复

使用道具 举报

     
发表于 2026-4-29 19:54 | 显示全部楼层

数据库里都炼了些什么奇奇怪怪的东西

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-29 19:55 | 显示全部楼层
我嘞了个去,也真的是气笑了,我朋友居然就正好刷到测试资格了,好气呀!

—— 来自 S1Fun
回复

使用道具 举报

发表于 2026-4-29 19:57 来自手机 | 显示全部楼层
本帖最后由 ArthurDent 于 2026-4-29 20:05 编辑

1/3有点菜


—— 来自 Xiaomi 2112123AC, Android 13, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-29 20:08 | 显示全部楼层

瑟瑟那个对了?
回复

使用道具 举报

     
发表于 2026-4-29 20:14 | 显示全部楼层

看你用的什么软件调用api,调用时thinking type disabled就行

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-29 20:17 | 显示全部楼层


蠢蠢的,认不太出动画人物,但让它做中学图形题还可以

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2026-4-29 20:20 | 显示全部楼层
这个多模态模型大概率是个实验性的小模型,如果可行的话才会合并进主线里
多模态确实方便很多,截图比复制容易多了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-29 20:21 来自手机 | 显示全部楼层
有了识图,我随手写的带图笔记可以让DS整理文档了

—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-29 20:23 | 显示全部楼层
看来训练数据不多,上面回答伊蕾娜明显就是纯编的
回复

使用道具 举报

     
发表于 2026-4-29 20:24 来自手机 | 显示全部楼层
被推送了识图模式,能力很难评,能够认得一些地标建筑,知道热门二游人物,但是推理能力还比较弱,远不如纯语言模型。
回复

使用道具 举报

     
发表于 2026-4-29 20:26 | 显示全部楼层
yudms1 发表于 2026-4-29 20:24
被推送了识图模式,能力很难评,能够认得一些地标建筑,知道热门二游人物,但是推理能力还比较弱,远不如纯 ...

真人的图如何?看看幻方的数据主要向哪个方向的。
回复

使用道具 举报

发表于 2026-4-29 20:31 来自手机 | 显示全部楼层
zerona 发表于 2026-4-29 20:08
瑟瑟那个对了?

就认出来个

—— 来自 Xiaomi 2112123AC, Android 13, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-4-29 20:31 来自手机 | 显示全部楼层
看有识图去试了下,分别是v和二游还有动画人物,三个全错一个都没认出来,这识别率完全用不了吧
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 20:47 , Processed in 0.182889 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表