7776169 发表于 2026-1-2 20:00

千问那可比造像需求的显存高多了(

zy450 发表于 2026-1-2 23:47

cym887 发表于 2026-1-2 17:53
让它画胸部从小到大的对比图 结果画出来全都一个大小 不太行

只能玩玩姿势

cym887 发表于 2026-1-3 12:54

本帖最后由 cym887 于 2026-1-3 13:05 编辑

试了下 2512 用上那个Qwen-Image-Lightning-4steps-V1.0 4步出图 3070也能玩 一两分钟出一张1024-1360的图(在遵循提示词这块属于是吊打zit了) 不过这nsfw和zit一个尿性 性器官扭曲的一批 还是得等社区弄出nsfw版    这两张图的提示词之前用zit跑过 全都不能看


cym887 发表于 2026-1-4 12:54

能直接用qwen的lora 但是qwen lora 有点少

Tr火药味 发表于 2026-1-4 13:36

话说这楼里大部分图我都看不到,无限转圈。是我的问题吗?

cym887 发表于 2026-1-4 17:27

本帖最后由 cym887 于 2026-1-4 17:55 编辑

2511编辑是垃圾,不让小孩开大车,单独的男性腿部转换成正太,可以,
但是图片上有个女性,想把图片上成年男性腿部换成正太就死活不改了,明明图片毫无露点啥的。

sennheiser 发表于 2026-1-7 11:12

我看了一圈,还是老老实实待在z-image上不动完事,毕竟我笔记本3050显卡这东西还是Z模型能出片。。。。。。。。。。。。。。。。

妄想中毒 发表于 2026-1-7 16:52

本帖最后由 妄想中毒 于 2026-1-7 16:53 编辑

我发现我完全不会写自然语言提示词,感觉danbooru标签反而更容易理解一点,反推模型对nsfw又没用,现在只能看c站别人的图是怎么写提示词

正在加载99 发表于 2026-1-7 20:12

妄想中毒 发表于 2026-1-7 16:52
我发现我完全不会写自然语言提示词,感觉danbooru标签反而更容易理解一点,反推模型对nsfw又没用,现在只能 ...

提示词可以用 BennyDaBall/qwen3-4b-Z-Image-Engineer。
可以导入 Ollama,能直接给你补全提示词。

连续对话直接保持主体更换场景


想要直接用在 comfyUI 工作流里面的话,将 qwen3-4b-Z-Image-Engineer 提供的自定义节点改一下网络请求格式就行了。很简单我就不展开了。

sennheiser 发表于 2026-1-8 17:54

我之前看过24年的一个视频,这些反推提示词,还是gemini专业,基本能复原原图。。。。。。。。。。。。。。。。

drx66 发表于 2026-1-12 21:32

官方的FP4的zit出了,好用爱用
https://hf-mirror.com/Comfy-Org/z_image_turbo/tree/main/split_files/diffusion_models




noword 发表于 2026-1-13 08:41

有点开始挤牙膏了

tonyunreal 发表于 2026-1-28 00:03

本帖最后由 tonyunreal 于 2026-1-28 00:42 编辑

Z-Image基础版发布了
https://www.modelscope.cn/models/Tongyi-MAI/Z-Image

ComfyUI用的版本:
https://www.modelscope.cn/models/Comfy-Org/z_image/tree/master/split_files/diffusion_models

在线试用:
https://www.modelscope.cn/aigc/i ... 3Frevision%3Dmaster

https://resouces.modelscope.cn/proxy-image/6b8082636cddd0b29fe92bbed1156077612eb1debf5083a26322f91361a472f3.jpeg

https://resouces.modelscope.cn/proxy-image/f78116bb53f7d492e8f60feac72a78fa77e04ef1f78584c22e29dec4b7c6719b.jpeg

tonyunreal 发表于 2026-1-28 00:18

本帖最后由 tonyunreal 于 2026-1-28 00:20 编辑

Z-Image vs 我自己的lora

https://p.sda1.dev/30/bb60c934ed3deb86f8f47585f2577848/4e0c3ecdb0254776a3154cd7c9a388e5.png

https://p.sda1.dev/30/c358fbc920ca6ffc8db0b11f613d805f/ComfyUI_temp_yhjce_00001_.png

tonyunreal 发表于 2026-1-28 00:23

Z-Image vs Z-Image-Turbo

https://p.sda1.dev/30/b697c44ac6ba71f90b1836bd8a774a33/c15fcc81c97f415fb873fbc0acc60fd9.png

https://p.sda1.dev/30/a8d59141c25da809774d1a3f68dedfe6/bcqcccclln3g1.jpg

tonyunreal 发表于 2026-1-28 02:14

部署好了,试了一下我的lora测试提示词
左边turbo 右边base

https://p.sda1.dev/30/60ba69d9b7b46f989f96b691ffa9ce90/comparison01.jpg

https://p.sda1.dev/30/c1c7ee66b174c6c51484bdf5ef2f8766/comparison02.jpg

https://p.sda1.dev/30/9c459d395dad2bc978c65fef99e5fd75/comparison03.jpg

https://p.sda1.dev/30/e7d4cbe1e07cfe9b0567610bf8a3c2c4/comparison04.jpg

https://p.sda1.dev/30/b1b68d4bb7c82c43d27049b080557f69/comparison05.jpg

https://p.sda1.dev/30/a58e30e34669713111342e8fa400127b/comparison06.jpg

https://p.sda1.dev/30/33e9d4057f853712c816680e0eb1da4a/comparison07.jpg

https://p.sda1.dev/30/d6615df75227cbe847a62d3c32bc9790/comparison08.jpg

https://p.sda1.dev/30/f7987522a9d0bf8e62a054bc4b4371bc/comparison09.jpg

https://p.sda1.dev/30/045909c00dfbd89b1980435aea4e893a/comparison10.jpg

https://p.sda1.dev/30/eda6e11ba44c4eccedc97b42afdfa31f/comparison11.jpg

https://p.sda1.dev/30/933df324bf06ac74c588c4b8199a07a3/comparison12.jpg

noword 发表于 2026-1-28 08:57

等大神微调了?

tonyunreal 发表于 2026-1-28 19:56

抄了一个好用的负面提示词
顺便测试今天新炼的lora

https://p.sda1.dev/30/ade40653ae4a33e30a8ac889a28c3df7/ComfyUI_20260128193919_00001_.jpg

https://p.sda1.dev/30/1827703e9ae05a3bfccb306a540c237d/ComfyUI_20260128195043_00001_.jpg

处男鉴黄师 发表于 2026-1-28 22:05

不是传说中还有类似qwen edit的编辑图片版吗?好像叫omni版?

tonyunreal 发表于 2026-1-28 22:32

处男鉴黄师 发表于 2026-1-28 22:05
不是传说中还有类似qwen edit的编辑图片版吗?好像叫omni版?

omni是base和edit的共祖基础版
edit是图像编辑模型
这俩现在都还没放

这次只放了base还有image2lora

—— 来自 Xiaomi 25060RK16C, Android 16, 鹅球 v3.5.99

处男鉴黄师 发表于 2026-1-28 22:41

tonyunreal 发表于 2026-1-28 22:32
omni是base和edit的共祖基础版
edit是图像编辑模型
这俩现在都还没放

期待edit版。klein 9b欧美风格太浓重,qwen edit体量太大lora太难炼。

tonyunreal 发表于 2026-1-28 23:23

处男鉴黄师 发表于 2026-1-28 22:41
期待edit版。klein 9b欧美风格太浓重,qwen edit体量太大lora太难炼。

klein的编辑功能作为本地模型来说已经是超强了
我觉得z-image edit应该打不过

不过有竞争总是好的

Luminous脑壳痛 发表于 2026-1-31 23:18

小白还是想借楼问一下,只是想把喜欢的角色换到各种色图里需要去找哪个ai最好使啊

Onelooker 发表于 2026-1-31 23:56

Luminous脑壳痛 发表于 2026-1-31 23:18
小白还是想借楼问一下,只是想把喜欢的角色换到各种色图里需要去找哪个ai最好使啊 ...

本地模型的话去c站找WAI-illustrious

zerona 发表于 2026-2-1 00:02

本帖最后由 zerona 于 2026-2-1 00:06 编辑

问下现在这个是真人转动漫还是动漫转真人的?

astkaasa 发表于 2026-2-17 17:41

bytedance出了个bitdance。。。

tonyunreal 发表于 2026-2-17 19:19

astkaasa 发表于 2026-2-17 17:41
bytedance出了个bitdance。。。

本地部署生图,autoregressive模型是不如diffusion模型的,前者体积大效果差
主要是拿来跟LLM做集成用的

拉屎 发表于 2026-2-25 00:13

https://p.sda1.dev/31/546d687695315de1da5d3e4056f18aed/image.jpg

自我感觉不错,特来分享

—— 来自 vivo V2329A, Android 16, 鹅球 v3.5.99

zerona 发表于 2026-2-25 00:55

拉屎 发表于 2026-2-25 00:13
自我感觉不错,特来分享

—— 来自 vivo V2329A, Android 16, 鹅球 v3.5.99

求个注释词,我搞了一个,但是感觉出来的图感觉没那么好。我想用下其他人的然后做下对比,是不是用的底模不对。

拉屎 发表于 2026-2-25 07:34

zerona 发表于 2026-2-25 00:55
求个注释词,我搞了一个,但是感觉出来的图感觉没那么好。我想用下其他人的然后做下对比,是不是用的底模 ...

光线问题,只要加上在漫展上,就会好很多

—— 来自 vivo V2329A, Android 16, 鹅球 v3.5.99

zerona 发表于 2026-2-25 11:09

拉屎 发表于 2026-2-25 07:34
光线问题,只要加上在漫展上,就会好很多

—— 来自 vivo V2329A, Android 16, 鹅球 v3.5.99 ...

还能这么写?我一般也就是写室内室外

拉屎 发表于 2026-2-26 15:46

zerona 发表于 2026-2-25 11:09
还能这么写?我一般也就是写室内室外

室内室外的光源不同呀

—— 来自 vivo V2329A, Android 16, 鹅球 v3.5.99

Freakyyu 发表于 2026-2-27 21:25

求问我4070最高能跑个啥模型啊(搞真人化的nsfw),从Hugging Face上下了个Devstral-Small-2-24B-Instruct-2512-Q8_0.gguf,拿Gemini写了ComfyUI工作流,把之前喂给Nano Banana的英文prompt改了改丢了进去,跑出来的图有点不尽如人意是不是还是ZIT好使

处男鉴黄师 发表于 2026-2-27 21:45

Freakyyu 发表于 2026-2-27 21:25
求问我4070最高能跑个啥模型啊(搞真人化的nsfw),从Hugging Face上下了个Devstral-Small-2-24B-Instruct- ...

看名字应该是qwen image edit 2512的微调版。怎么说呢,qwen image模型有一些硬伤,导致某些方面表现不大行

Freakyyu 发表于 2026-2-27 22:53

处男鉴黄师 发表于 2026-2-27 21:45
看名字应该是qwen image edit 2512的微调版。怎么说呢,qwen image模型有一些硬伤,导致某些方面表现不大 ...

所以还是ZIT好用点是吧那Hugging Face上哪个版本的模型好使呢(我是今天刚开始鼓捣的菜逼)

处男鉴黄师 发表于 2026-2-27 23:28

Freakyyu 发表于 2026-2-27 22:53
所以还是ZIT好用点是吧那Hugging Face上哪个版本的模型好使呢(我是今天刚开始鼓捣的菜逼) ...

看你的需求,以下在开源模型范围里而言:二次元(包括2.5次元)目前仍然是基于SDXL训练的光辉系列最强,甚至侧重某些器官表现的三次元nsfw也是如此;三次元(非nsfw)zit综合而言最强;图片编辑qwen image edit 2512综合而言最强,klein某些方面表现更好。

hencechen 发表于 2026-2-27 23:39

本帖最后由 hencechen 于 2026-2-27 23:40 编辑

处男鉴黄师 发表于 2026-2-27 23:28
看你的需求,以下在开源模型范围里而言:二次元(包括2.5次元)目前仍然是基于SDXL训练的光辉系列最强, ...

谢谢解惑!

那我也搭车问一下,如果是三次元轻微擦边图呢,推荐哪种本地部署模型?

主要目的是给写的都市言情小说配插图,你懂的,有一些轻微nsfw和暧昧擦边动作(比如内衣舌吻,比较露骨姿势的搂抱等),但是不需要直球性器官(有个被雨淋湿的半透明白衬衫凸点顶天了),但是一定要是照片风格+真人形象如果这种需求,部署什么好?求助

处男鉴黄师 发表于 2026-2-27 23:59

hencechen 发表于 2026-2-27 23:39
谢谢解惑!

那我也搭车问一下,如果是三次元轻微擦边图呢,推荐哪种本地部署模型?

zit有个所谓官方版真实照片风格的微调模型,名字忘了你找找
建议谨慎使用民间各种乱七八糟的版本,这些版本大都是把各种杂七杂八的lora融合进原版模型而成,某些表现可能很突出但往往伴随着明显缺陷。

zerona 发表于 2026-2-28 02:41

我看c站已经有一些 zit 的2.5次元的lora了。但是不知道啥问题,出来的图都是极其二次元扁平以及大色块的艺术风。光辉这一系要是能像zit 使用注释词可以又多又准就好了。
页: 1 2 3 4 [5]
查看完整版本: (ai绘图可能nsfw)Z-Image-Turbo专楼(base版已出)