此誓的守望 发表于 2026-4-29 15:23

鲸鱼要睁眼了 deepseek开始视觉模型灰度测试








对话链接: https://chat.deepseek.com/share/ablc57vmv2ompm3vy6

cym887 发表于 2026-4-29 16:02

识图早就有了啊 你破甲后 传一张有文字的涩图 然后问图片内容 它就会把文字和图片内容一起说 还有单独的Janus-Pro-7B 这种识图模型 主要是这么久都没出生图 更别提视频了

明斯克 发表于 2026-4-29 16:04

我凸(艹**艹 )    这AI要是用在导弹制导上    那不是......

noword 发表于 2026-4-29 16:07

明斯克 发表于 2026-4-29 16:04
我凸(艹**艹 )    这AI要是用在导弹制导上    那不是......

几乎不可能,非常慢

唯登诗树 发表于 2026-4-29 17:36

明斯克 发表于 2026-4-29 16:04
我凸(艹**艹 )    这AI要是用在导弹制导上    那不是......

早就应用很久了,用缩比模型训练ai视觉识别

油条小贩 发表于 2026-4-29 17:47

ai机器狗,无人机?

此誓的守望 发表于 2026-4-29 17:52

本帖最后由 此誓的守望 于 2026-4-29 18:12 编辑




阿萨辛艾沃尔 发表于 2026-4-29 18:12

利好AIRP

乌鱼子余污 发表于 2026-4-29 18:13

星花 发表于 2026-4-29 18:42

本帖最后由 星花 于 2026-4-29 18:44 编辑

没用过手机识图么?还造各种航母战舰壳子训练呐。

JITAN 发表于 2026-4-29 19:05

用来反推tag了

ayanamilin 发表于 2026-4-29 19:16

不仅是识图啦,可能是个多模态模型,支持多模态理解和输出的。

世界不要这样 发表于 2026-4-29 20:20

???你们是只用ds不用豆包等其他玩意的?多模态图像识别都玩烂了
他连我哪拍的都知道https://p.sda1.dev/32/82abc4a230a1b4286aeead55edd4bb3c/image.jpg

Wiedzmin 发表于 2026-4-29 20:24

世界不要这样 发表于 2026-4-29 20:20
???你们是只用ds不用豆包等其他玩意的?多模态图像识别都玩烂了
他连我哪拍的都知道 ...

是不是你的照片有GPS信息

世界不要这样 发表于 2026-4-29 21:03

本帖最后由 世界不要这样 于 2026-4-29 21:13 编辑

Wiedzmin 发表于 2026-4-29 20:24
是不是你的照片有GPS信息
当然没有,我用微信拍了个朝鲜银行某个局部鸟居风的门栏,他都能直接识别出来,并纠正我说这是朝鲜银行(我没和他提这是朝鲜银行)的唐破风门栏,不是鸟居风

说错了是旧大连市役所

darklinden 发表于 2026-4-29 21:36

虽然唐包唐,多模态国模数一数二的可是唐包,毕竟用户量在那儿
而且用户免费用的好像是唐包1.5,API已经出到2.0了

—— 来自 S1Fun

Bronzecraft 发表于 2026-4-30 05:42

没有灰度到测试资格,但我直接在网页版把图片以附件的形式上传,发现也可以被识别出来。

行政裁定书 发表于 2026-4-30 08:21

快点来吧,把所有ai的价格都打下来。

鲸震恩

overflowal 发表于 2026-4-30 09:27

Bronzecraft 发表于 2026-4-30 05:42
没有灰度到测试资格,但我直接在网页版把图片以附件的形式上传,发现也可以被识别出来。 ...

那应该是ocr吧    Re:Source

hairen 发表于 2026-4-30 11:01

找几张ai图试试深浅
https://p.sda1.dev/32/a5b2348b89e1b268ac8bad7d805e9bf9/image.jpg
https://p.sda1.dev/32/0a3d3d94fcfdb812314d890984a36fde/image.jpg
https://p.sda1.dev/32/5e091b7622698b4f23c9ae8898048dae/image.jpg

—— 来自 鹅球 v3.5.99
页: [1]
查看完整版本: 鲸鱼要睁眼了 deepseek开始视觉模型灰度测试