找回密码
 立即注册
搜索
查看: 2776|回复: 18

[其他] 国内AI现在生图有能和Nano Banana差不多的吗

[复制链接]
     
发表于 2026-3-16 20:52 | 显示全部楼层 |阅读模式
国内几个主流的用下来,感觉对描述的理解能力比Nano Banana差好多。

回复

使用道具 举报

     
发表于 2026-3-16 21:25 来自手机 | 显示全部楼层
我自己试下来的体感是没有,我感觉nano banana 2几乎是断档第一。
回复

使用道具 举报

     
发表于 2026-3-16 21:26 | 显示全部楼层
z imagine还可以吧?
回复

使用道具 举报

     
发表于 2026-3-16 21:40 | 显示全部楼层

完全不是一个等级。
回复

使用道具 举报

     
发表于 2026-3-16 21:42 | 显示全部楼层
本帖最后由 バーチャルS1er 于 2026-3-16 22:01 编辑

目前没有,主要是识图能力的差距,生图改图前先得自己能”看到“

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-3-16 21:44 | 显示全部楼层
指令跟随这一块nanobanana pro 2就是无争议的第一,你在网上可以搜到很多现成的极为复杂的json格式生图指令,人物姿势、镜头、打光、质感全给你指定一遍,关键是大香蕉真的能听懂并遵从这些复杂指令。

grok的生图能力也还不错。开源模型的话我试过 z-image(真实感这块还可以)、qwen-image(人物太油了)、qwen-image-edit(难以理解复杂的空间关系),指令跟随能力无一例外都很差。
回复

使用道具 举报

     
 楼主| 发表于 2026-3-16 22:37 | 显示全部楼层
好吧 确实和楼上两位说的一样,对本身图的理解和指令追随真的没找到能对比的。

3Q
回复

使用道具 举报

     
发表于 2026-3-16 23:26 来自手机 | 显示全部楼层
banana目前的汉字嵌入还是不行
回复

使用道具 举报

     
发表于 2026-3-16 23:32 来自手机 | 显示全部楼层
用汉字我用下来gpt比banana强,但是我GPT调了很久,banana没来得及调pc给我ban了,手机上又不好操作

—— 来自 Sony XQ-DQ72, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-3-16 23:59 来自手机 | 显示全部楼层
全球也没有能打过它的
国外那些社交媒体上钓鱼的假照片全是gemini做的

—— 来自 Xiaomi 25060RK16C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-3-17 00:24 来自手机 | 显示全部楼层
即梦吧,但是这几天用新模型时感觉有点降智了

—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99
回复

使用道具 举报

     
 楼主| 发表于 2026-3-17 00:27 | 显示全部楼层
pointer243 发表于 2026-3-17 00:24
即梦吧,但是这几天用新模型时感觉有点降智了

—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99 ...

真不行,对指令理解能力差太多了。

而且提供的图理解也有问题
回复

使用道具 举报

发表于 2026-3-17 01:05 来自手机 | 显示全部楼层
泪指环 发表于 2026-3-17 00:27
真不行,对指令理解能力差太多了。

而且提供的图理解也有问题

论精细度确实哈基米最强,这几天用即梦刷图做lora都是在用哈基米打一份底稿再送进去量产

—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-3-17 01:57 | 显示全部楼层
Qwen edit一些功能要强一点,不过要插件

nanobanana这个性能感觉不稳定,经常会block掉
回复

使用道具 举报

     
发表于 2026-3-17 02:03 | 显示全部楼层
设计狗,和工友们讨论过,gemini就是最好的,做设计的话lovart。
我们一致认为即梦只有第一波抽奖是动过脑子的,然后就会耍无赖(这点很像人)。不过我们会自己改,所以便捷度来说最优吧
回复

使用道具 举报

     
发表于 2026-3-17 02:59 | 显示全部楼层
看用途。seedream 4.5在 提取人脸 这项能力上断层top,程度类似gemini在 指令跟随 能力上的领先
回复

使用道具 举报

     
发表于 2026-3-17 09:01 来自手机 | 显示全部楼层
本帖最后由 masonknight 于 2026-3-17 09:03 编辑

商业出图的话豆包(即梦)勉强能用,但和香蕉的差距还是太大了
回复

使用道具 举报

     
发表于 2026-3-17 09:14 | 显示全部楼层
Seedance2.0如果论空间理解、动作理解和镜头/构图理解,是比nanobanana2强的,不过这是个视频模型

评分

参与人数 1战斗力 +1 收起 理由
秦南心 + 1 场景人物也吊打大香蕉

查看全部评分

回复

使用道具 举报

     
发表于 2026-3-17 09:19 | 显示全部楼层
gpt的审美比大香蕉更强一些,后期合成效果好,最新版好像削弱了审美增强了一点指令
z image至少开源不用管超级敏感的谷歌审核
即梦生图模型搞奇幻写实风格比大香蕉强太多,

大香蕉搞风格特化一塌糊涂,比较强的点是模仿色彩、渲染……生成的图必然添加香蕉味
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-25 04:43 , Processed in 0.124149 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表