鲸鱼要睁眼了 deepseek开始视觉模型灰度测试
对话链接: https://chat.deepseek.com/share/ablc57vmv2ompm3vy6
识图早就有了啊 你破甲后 传一张有文字的涩图 然后问图片内容 它就会把文字和图片内容一起说 还有单独的Janus-Pro-7B 这种识图模型 主要是这么久都没出生图 更别提视频了 我凸(艹**艹 ) 这AI要是用在导弹制导上 那不是...... 明斯克 发表于 2026-4-29 16:04
我凸(艹**艹 ) 这AI要是用在导弹制导上 那不是......
几乎不可能,非常慢 明斯克 发表于 2026-4-29 16:04
我凸(艹**艹 ) 这AI要是用在导弹制导上 那不是......
早就应用很久了,用缩比模型训练ai视觉识别 ai机器狗,无人机? 本帖最后由 此誓的守望 于 2026-4-29 18:12 编辑
艹
利好AIRP 本帖最后由 星花 于 2026-4-29 18:44 编辑
没用过手机识图么?还造各种航母战舰壳子训练呐。 用来反推tag了 不仅是识图啦,可能是个多模态模型,支持多模态理解和输出的。 ???你们是只用ds不用豆包等其他玩意的?多模态图像识别都玩烂了
他连我哪拍的都知道https://p.sda1.dev/32/82abc4a230a1b4286aeead55edd4bb3c/image.jpg 世界不要这样 发表于 2026-4-29 20:20
???你们是只用ds不用豆包等其他玩意的?多模态图像识别都玩烂了
他连我哪拍的都知道 ...
是不是你的照片有GPS信息 本帖最后由 世界不要这样 于 2026-4-29 21:13 编辑
Wiedzmin 发表于 2026-4-29 20:24
是不是你的照片有GPS信息
当然没有,我用微信拍了个朝鲜银行某个局部鸟居风的门栏,他都能直接识别出来,并纠正我说这是朝鲜银行(我没和他提这是朝鲜银行)的唐破风门栏,不是鸟居风
说错了是旧大连市役所
虽然唐包唐,多模态国模数一数二的可是唐包,毕竟用户量在那儿
而且用户免费用的好像是唐包1.5,API已经出到2.0了
—— 来自 S1Fun 没有灰度到测试资格,但我直接在网页版把图片以附件的形式上传,发现也可以被识别出来。 快点来吧,把所有ai的价格都打下来。
鲸震恩 Bronzecraft 发表于 2026-4-30 05:42
没有灰度到测试资格,但我直接在网页版把图片以附件的形式上传,发现也可以被识别出来。 ...
那应该是ocr吧 Re:Source 找几张ai图试试深浅
https://p.sda1.dev/32/a5b2348b89e1b268ac8bad7d805e9bf9/image.jpg
https://p.sda1.dev/32/0a3d3d94fcfdb812314d890984a36fde/image.jpg
https://p.sda1.dev/32/5e091b7622698b4f23c9ae8898048dae/image.jpg
—— 来自 鹅球 v3.5.99
页:
[1]