Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---
你这明显也不像它老板啊,而且梁圣在互联网上的照片可能就几张 Re:Source
Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---
感觉这图是没触发识图,只是OCR识别出文字了
目前看起来更像是外挂了一个识别tag的模型,并不是原生多模态,不过能解决有没有的问题也不错
怎么还没灰度到我,太慢了吧
Surlert 发表于 2026-4-29 16:26
一般
原来我的头像是龙背上的破鞋吗
Re:Source · Xiaomi 15
试了下,没问题,思考链是纯识别出来的https://p.sda1.dev/32/0487bfdebca33117f2d06a184cbf05b2/image.jpg
—— 来自 OPPO PLG110, Android 16, 鹅球 v3.5.99
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗
有鱼 发表于 2026-4-29 17:27
只是翻译网页的话,肯定是用v4f,又便宜又快
论坛助手,iPhone
不是v4f吗
好像app已经推了,但我没有灰度到
Onelooker 发表于 2026-4-29 17:25
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗
翻译很难命中缓存,也就是你就是硬吃正价 Re:Source
现在识图进化到生图难不难?
—— 来自 HUAWEI ADY-AL10, Android 12, 鹅球 v3.5.99-alpha
1224700457 发表于 2026-4-29 17:54
现在识图进化到生图难不难?
—— 来自 HUAWEI ADY-AL10, Android 12, 鹅球 v3.5.99-alpha ...
可以做,但是效果没法做到顶尖。
所以一般还是限定输出单模态的。openai也是这么搞的。这方面还欠一个先驱
没有被灰度到的人有难了
论坛助手,iPhone
生图反而是真不急的,首先头部闭源image-2和香蕉真不贵,用量也没那么大,然后nsfw,本地因为硬件在那出品也不能指望立刻脱胎换骨,二次元nsfw还有线上的nai呢
deepseek提供视觉功能了也未必是传统实现方案的,到时候看论文,说不定那个路线是可以比较容易实现逆输出的。
OCR那个论文有说靠LLM本身的能力实现视觉,不知道是不是应用在这个上面
Onelooker 发表于 2026-4-29 17:25
v4p api挂了个网页翻译, 翻几个网页就走了两毛, 这么耗的吗
翻译的话用flash关thinking就好
论坛助手,iPhone
已经开放使用了?
比利的微笑 发表于 2026-4-29 19:19
已经开放使用了?
灰度测试罢了,不是所有人都有,看了一下我自己的,就没有。
—— 来自 S1Fun
本帖最后由 INDIASH 于 2026-4-29 19:35 编辑
Geronimo 发表于 2026-4-29 16:35
我也有资格,不过我没有二次元图图。
拍了个饼干倒是认出来了。
---
左边的人: 东亚男性,戴眼镜,穿蓝色西装外套,打白色衬衫,面带自信、略带笑容的表情。这与梁文锋(DeepSeek的创始人兼CEO/实际领导者)的公开露面高度吻合。
拿1165楼里的图试了下,还是能识别出来的
应该是衣服问题
我也灰度到了,目前用起来还很猪比,可能和之前v4l灰度一样拿了个小模型测试
Nanachi 发表于 2026-4-29 19:18
翻译的话用flash关thinking就好
论坛助手,iPhone
thinking怎么关
有个问题想问一下,现在的网页版快速模式和专家模式到底是啥模型?
感觉既没flash这么快又没pro这么聪明,专家和快速我好像也用不出什么差别。
serj005 发表于 2026-4-29 19:35
有个问题想问一下,现在的网页版快速模式和专家模式到底是啥模型?
感觉既没flash这么快又没pro这么聪明, ...
快速模式V4f-high
专家模式V4p-high
思维链比调用API开max短一些。
数据库里都炼了些什么奇奇怪怪的东西
我嘞了个去,也真的是气笑了,我朋友居然就正好刷到测试资格了,好气呀!
—— 来自 S1Fun
本帖最后由 ArthurDent 于 2026-4-29 20:05 编辑
1/3有点菜https://p.sda1.dev/32/5349914b4f3d6f721170da15758bd6ce/image.jpg
https://p.sda1.dev/32/a4c739d424f82b060abc12f897d300c8/image.jpghttps://p.sda1.dev/32/3c44ea6c0b3becbcc0b5942437d94a43/image.jpg
—— 来自 Xiaomi 2112123AC, Android 13, 鹅球 v3.5.99
ArthurDent 发表于 2026-4-29 19:57
1/3有点菜
瑟瑟那个对了?
passgan 发表于 2026-4-29 19:34
thinking怎么关
看你用的什么软件调用api,调用时thinking type disabled就行
论坛助手,iPhone
蠢蠢的,认不太出动画人物,但让它做中学图形题还可以
有了识图,我随手写的带图笔记可以让DS整理文档了
—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99
看来训练数据不多,上面回答伊蕾娜明显就是纯编的
被推送了识图模式,能力很难评,能够认得一些地标建筑,知道热门二游人物,但是推理能力还比较弱,远不如纯语言模型。
yudms1 发表于 2026-4-29 20:24
被推送了识图模式,能力很难评,能够认得一些地标建筑,知道热门二游人物,但是推理能力还比较弱,远不如纯 ...
真人的图如何?看看幻方的数据主要向哪个方向的。
zerona 发表于 2026-4-29 20:08
瑟瑟那个对了?
就认出来个
—— 来自 Xiaomi 2112123AC, Android 13, 鹅球 v3.5.99
看有识图去试了下,分别是v和二游还有动画人物,三个全错一个都没认出来,这识别率完全用不了吧