国内AI现在生图有能和Nano Banana差不多的吗
国内几个主流的用下来,感觉对描述的理解能力比Nano Banana差好多。我自己试下来的体感是没有,我感觉nano banana 2几乎是断档第一。 z imagine还可以吧? Demi.Albertini 发表于 2026-3-16 21:26
z imagine还可以吧?
完全不是一个等级。 本帖最后由 バーチャルS1er 于 2026-3-16 22:01 编辑
目前没有,主要是识图能力的差距,生图改图前先得自己能”看到“ 指令跟随这一块nanobanana pro 2就是无争议的第一,你在网上可以搜到很多现成的极为复杂的json格式生图指令,人物姿势、镜头、打光、质感全给你指定一遍,关键是大香蕉真的能听懂并遵从这些复杂指令。
grok的生图能力也还不错。开源模型的话我试过 z-image(真实感这块还可以)、qwen-image(人物太油了)、qwen-image-edit(难以理解复杂的空间关系),指令跟随能力无一例外都很差。 好吧 确实和楼上两位说的一样,对本身图的理解和指令追随真的没找到能对比的。
3Q banana目前的汉字嵌入还是不行 用汉字我用下来gpt比banana强,但是我GPT调了很久,banana没来得及调pc给我ban了,手机上又不好操作
—— 来自 Sony XQ-DQ72, Android 15, 鹅球 v3.5.99 全球也没有能打过它的
国外那些社交媒体上钓鱼的假照片全是gemini做的
—— 来自 Xiaomi 25060RK16C, Android 16, 鹅球 v3.5.99 即梦吧,但是这几天用新模型时感觉有点降智了
—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99 pointer243 发表于 2026-3-17 00:24
即梦吧,但是这几天用新模型时感觉有点降智了
—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99 ...
真不行,对指令理解能力差太多了。
而且提供的图理解也有问题 泪指环 发表于 2026-3-17 00:27
真不行,对指令理解能力差太多了。
而且提供的图理解也有问题
论精细度确实哈基米最强,这几天用即梦刷图做lora都是在用哈基米打一份底稿再送进去量产
—— 来自 LGE LM-Q730, Android 10, 鹅球 v3.5.99 Qwen edit一些功能要强一点,不过要插件
nanobanana这个性能感觉不稳定,经常会block掉 设计狗,和工友们讨论过,gemini就是最好的,做设计的话lovart。
我们一致认为即梦只有第一波抽奖是动过脑子的,然后就会耍无赖(这点很像人)。不过我们会自己改,所以便捷度来说最优吧 看用途。seedream 4.5在 提取人脸 这项能力上断层top,程度类似gemini在 指令跟随 能力上的领先 本帖最后由 masonknight 于 2026-3-17 09:03 编辑
商业出图的话豆包(即梦)勉强能用,但和香蕉的差距还是太大了 Seedance2.0如果论空间理解、动作理解和镜头/构图理解,是比nanobanana2强的,不过这是个视频模型 gpt的审美比大香蕉更强一些,后期合成效果好,最新版好像削弱了审美增强了一点指令
z image至少开源不用管超级敏感的谷歌审核
即梦生图模型搞奇幻写实风格比大香蕉强太多,
大香蕉搞风格特化一塌糊涂,比较强的点是模仿色彩、渲染……生成的图必然添加香蕉味
页:
[1]