鲸鱼要睁眼了 deepseek开始视觉模型灰度测试

此誓的守望 发表于 2026-4-29 15:23

对话链接： https://chat.deepseek.com/share/ablc57vmv2ompm3vy6

cym887 发表于 2026-4-29 16:02

识图早就有了啊你破甲后传一张有文字的涩图然后问图片内容它就会把文字和图片内容一起说还有单独的Janus-Pro-7B 这种识图模型主要是这么久都没出生图更别提视频了

明斯克 发表于 2026-4-29 16:04

我凸(艹**艹 ) 这AI要是用在导弹制导上那不是......

noword 发表于 2026-4-29 16:07

明斯克发表于 2026-4-29 16:04
我凸(艹**艹 ) 这AI要是用在导弹制导上那不是......

几乎不可能，非常慢

唯登诗树 发表于 2026-4-29 17:36

明斯克发表于 2026-4-29 16:04
我凸(艹**艹 ) 这AI要是用在导弹制导上那不是......

早就应用很久了，用缩比模型训练ai视觉识别

油条小贩 发表于 2026-4-29 17:47

ai机器狗，无人机？

此誓的守望 发表于 2026-4-29 17:52

本帖最后由此誓的守望于 2026-4-29 18:12 编辑

艹

阿萨辛艾沃尔 发表于 2026-4-29 18:12

利好AIRP

乌鱼子余污 发表于 2026-4-29 18:13

星花发表于 2026-4-29 18:42

本帖最后由星花于 2026-4-29 18:44 编辑

没用过手机识图么？还造各种航母战舰壳子训练呐。

JITAN 发表于 2026-4-29 19:05

用来反推tag了

ayanamilin 发表于 2026-4-29 19:16

不仅是识图啦，可能是个多模态模型，支持多模态理解和输出的。

世界不要这样 发表于 2026-4-29 20:20

？？？你们是只用ds不用豆包等其他玩意的？多模态图像识别都玩烂了
他连我哪拍的都知道https://p.sda1.dev/32/82abc4a230a1b4286aeead55edd4bb3c/image.jpg

Wiedzmin 发表于 2026-4-29 20:24

世界不要这样发表于 2026-4-29 20:20
？？？你们是只用ds不用豆包等其他玩意的？多模态图像识别都玩烂了
他连我哪拍的都知道 ...

是不是你的照片有GPS信息

世界不要这样 发表于 2026-4-29 21:03

本帖最后由世界不要这样于 2026-4-29 21:13 编辑

Wiedzmin 发表于 2026-4-29 20:24
是不是你的照片有GPS信息
当然没有，我用微信拍了个朝鲜银行某个局部鸟居风的门栏，他都能直接识别出来，并纠正我说这是朝鲜银行（我没和他提这是朝鲜银行）的唐破风门栏，不是鸟居风

说错了是旧大连市役所

darklinden 发表于 2026-4-29 21:36

虽然唐包唐，多模态国模数一数二的可是唐包，毕竟用户量在那儿
而且用户免费用的好像是唐包1.5，API已经出到2.0了

—— 来自 S1Fun

Bronzecraft 发表于 2026-4-30 05:42

没有灰度到测试资格，但我直接在网页版把图片以附件的形式上传，发现也可以被识别出来。

行政裁定书 发表于 2026-4-30 08:21

快点来吧，把所有ai的价格都打下来。

鲸震恩

overflowal 发表于 2026-4-30 09:27

Bronzecraft 发表于 2026-4-30 05:42
没有灰度到测试资格，但我直接在网页版把图片以附件的形式上传，发现也可以被识别出来。 ...

那应该是ocr吧 Re:Source

hairen 发表于 2026-4-30 11:01

找几张ai图试试深浅
https://p.sda1.dev/32/a5b2348b89e1b268ac8bad7d805e9bf9/image.jpg
https://p.sda1.dev/32/0a3d3d94fcfdb812314d890984a36fde/image.jpg
https://p.sda1.dev/32/5e091b7622698b4f23c9ae8898048dae/image.jpg

—— 来自鹅球 v3.5.99

页: [1]

Stage1st's Archiver

鲸鱼要睁眼了 deepseek开始视觉模型灰度测试