ControlNet 是什么？AI 漫剧如何控制人物姿势和分镜构图

做 AI 漫剧时，很多人会遇到一个问题：AI 画得挺好看，但不听话。

你想让女主站在大厅中央，它偏偏坐在沙发上。

你想让男主从门口走进来，它直接给你画成半身特写。

你想让反派冷笑，它画成了面无表情。

你想要一个固定分镜构图，它每次都随机发挥。

这时候，就需要 ControlNet。

简单说：

ControlNet 是用来控制 AI 绘图结构的工具，可以让 AI 按照姿势、线稿、深度图、边缘图等条件生成画面。

如果说提示词负责告诉 AI “画什么”，那 ControlNet 更像是在告诉 AI “按什么结构画”。

ControlNet AI 漫剧姿势和分镜控制示意图

一、ControlNet 到底是什么？

ControlNet 是 Stable Diffusion 生态里非常重要的控制技术。

它可以给 AI 绘图增加额外条件，让图像生成不再完全靠随机。

你可以给它：

人物姿势图
线稿图
边缘图
深度图
涂鸦草图
分割图
参考构图

然后 AI 会在这些条件基础上生成图片。

对 AI 漫剧来说，ControlNet 的价值非常大。

因为 AI 漫剧最需要的是：

人物动作可控
镜头构图可控
分镜连续可控
场景结构可控
角色关系可控

只靠提示词，很难稳定做到这些。

二、为什么 AI 漫剧不能只靠提示词？

提示词当然重要，但它有天然局限。

比如你写：

女主站在豪门大厅中央，手里拿着亲子鉴定，周围人震惊，反派女配冷笑。

AI 大概知道你想要什么内容。

但它不一定能稳定控制：

女主站在画面哪个位置
手怎么拿文件
反派女配站在哪里
周围人是近还是远
镜头是全景还是中景
人物姿势是否符合剧情

这就是提示词的问题：

它擅长描述内容，但不擅长精确控制结构。

AI 漫剧需要分镜。

分镜不是随便好看就行，它要服务剧情。

ControlNet 就是为了解决“AI 不听构图”的问题。

三、ControlNet 在 AI 漫剧里能做什么？

1. 控制人物姿势

这是最常见用法。

你可以用 OpenPose 这类控制方式，让角色按照指定姿势生成。

比如：

女主站立
男主伸手
反派叉腰
人物回头
双人对峙
跪地求饶
拔剑动作
战斗姿势

AI 漫剧里有大量人物动作，如果只靠提示词，很容易跑偏。

ControlNet 可以让动作更稳定。

2. 控制分镜构图

AI 漫剧不是一张图，而是一组镜头。

你可能需要：

远景交代环境
中景表现冲突
近景表现表情
特写强化情绪
双人对峙镜头
群像围观镜头

通过参考图、边缘图、线稿图等方式，可以让 AI 更接近你想要的镜头结构。

3. 控制线稿上色

如果你会画简单草图，或者能拿到线稿，可以用 ControlNet 让 AI 按照线稿生成彩色漫画图。

适合：

漫画分镜上色
草图变成成品图
角色设定细化
场景草稿渲染

不会画得很精细也没关系，简单结构图也能提供方向。

4. 控制场景结构

AI 漫剧常见场景包括：

豪门大厅
公司会议室
宗门大殿
山门擂台
医院走廊
酒店宴会厅
城市街头

如果你希望场景结构稳定，可以用 Depth、Canny、Lineart 等方式控制。

这样每次生成的场景不会完全乱飞。

5. 控制短视频封面构图

AI 漫剧封面很重要。

封面通常需要：

人物大脸
强烈表情
冲突关系
大标题区域
背景不能太乱

你可以用简单构图图控制封面布局，再用 AI 生成画面。

四、ControlNet 和 LoRA 有什么区别？

很多新手会把 ControlNet 和 LoRA 混在一起。

其实它们不是一类东西。

对比项	LoRA	ControlNet
主要作用	控制风格、角色、服装、细节	控制姿势、结构、构图
输入内容	模型插件	条件图，如姿势图、线稿图、深度图
AI 漫剧用途	保持角色和画风稳定	保持动作和分镜可控
是否可叠加	可以	可以
新手理解	风格插件	结构控制器

简单说：

LoRA 让角色更像同一个人，ControlNet 让角色按你想要的动作和构图出现。

做 AI 漫剧时，二者经常一起用。

比如：

用 LoRA 固定女主长相
用 ControlNet 控制女主姿势
用提示词描述剧情场景
用 ComfyUI 工作流统一输出

这才是比较完整的玩法。

五、ControlNet 常见类型怎么选？

1. OpenPose

OpenPose 主要用于控制人物姿势。

适合：

人物站姿
动作镜头
双人互动
战斗姿势
跪地、回头、伸手等情节动作

如果你做 AI 漫剧，OpenPose 是最值得先学的类型。

2. Canny

Canny 主要提取图片边缘。

适合：

保留人物轮廓
保留建筑结构
控制画面大形
做风格转换

它控制感比较强，但有时会让画面显得僵硬。

3. Depth

Depth 用来控制空间深度。

适合：

室内场景
建筑场景
复杂空间
人物和背景关系

如果你想让豪门大厅、宗门大殿这类场景更稳定，Depth 很有用。

4. Lineart

Lineart 适合线稿上色。

适合：

漫画线稿
分镜草图
角色设计稿
场景线稿

如果你会画简单分镜，Lineart 很适合 AI 漫剧。

5. Scribble

Scribble 适合涂鸦草图。

你可以画一个很粗略的结构，让 AI 根据草图生成完整画面。

适合不会画画但想控制构图的新手。

六、ComfyUI 里怎么用 ControlNet？

在 ComfyUI 里，ControlNet 通常会涉及这些节点：

Load ControlNet Model
Apply ControlNet
Load Image
预处理器节点
KSampler
VAE Decode
Save Image

基础逻辑是：

加载主模型
加载 ControlNet 模型
输入参考图
用预处理器提取姿势、边缘或深度
把控制信息接入采样流程
生成图片

简单理解就是：

给 AI 一张结构参考图，让它照着这个结构生成。

ComfyUI 的优势是流程清晰，适合把 ControlNet 加入固定 AI 漫剧工作流。

七、WebUI 里怎么用 ControlNet？

WebUI 一般通过 ControlNet 扩展使用。

常见流程是：

打开 txt2img 或 img2img
打开 ControlNet 面板
上传参考图
选择预处理器
选择对应模型
设置控制权重
点击生成

WebUI 操作更直观，适合新手理解 ControlNet。

ComfyUI 更适合后期搭建复杂工作流。

八、ControlNet 权重怎么调？

ControlNet 通常有控制权重。

新手可以先参考这个范围：

权重	效果
0.3 - 0.5	轻度参考
0.6 - 0.8	常用范围
0.9 - 1.0	强控制
1.2 以上	可能太僵硬

做 AI 漫剧时，建议从 0.7 左右开始。

如果画面偏离参考图，提高权重。

如果画面太死板、细节崩坏，降低权重。

不要所有镜头都拉满。

分镜要可控，但也要自然。

九、ControlNet 为什么会失败？

1. 预处理器和模型不匹配

比如你用了 OpenPose 预处理器，却选了 Canny 模型，效果肯定不对。

预处理器和模型要对应。

2. 参考图太复杂

参考图里人物太多、背景太乱，AI 会抓不住重点。

新手建议先用简单参考图。

比如单人姿势图、清晰线稿、干净场景图。

3. 控制权重太高

权重太高会导致画面僵硬。

尤其是 Canny 和 Lineart，过强会让画面像描边图。

4. 提示词和参考图冲突

参考图是坐姿，提示词写奔跑。

参考图是古风场景，提示词写现代办公室。

这种冲突会让 AI 很难稳定输出。

5. 主模型不适合

不同模型对 ControlNet 的响应不同。

如果效果不好，可以换模型或换 ControlNet 类型测试。

十、AI 漫剧里怎么用 ControlNet 做分镜？

一个实用流程是：

第一步：先写剧情

比如：

女主被赶出豪门，拿出亲子鉴定，男主突然出现护住她。

第二步：拆成镜头

可以拆成：

女主站在大厅中央
女主低头拿出亲子鉴定
反派女配冷笑
男主从门口出现
男主站到女主身边
众人震惊

第三步：给每个镜头找姿势或构图参考

比如：

女主站立姿势
男主走入姿势
双人并肩构图
群像围观构图

第四步：用 ControlNet 控制结构

把参考图输入 ControlNet，再配合角色 LoRA 和提示词生成画面。

第五步：筛图和修图

AI 生成的图不可能每张都能用。

你需要筛掉：

脸崩
手崩
人物错位
构图混乱
表情不对

留下能服务剧情的图。

十一、ControlNet 适合哪些 AI 漫剧场景？

1. 双人对峙

比如男主和反派面对面，女主站在中间。

这种关系单靠提示词很难控制，ControlNet 更稳。

2. 战斗动作

修仙、玄幻、末世题材经常需要战斗动作。

OpenPose 可以帮助控制人物姿势。

3. 情绪特写

比如女主震惊、反派冷笑、男主愤怒。

虽然表情主要靠提示词和模型，但构图可以用 ControlNet 辅助。

4. 场景复用

同一个豪门大厅、宗门大殿、会议室，可以用参考结构保持一致。

5. 封面构图

AI 漫剧封面要一眼看懂冲突。

ControlNet 可以帮助固定人物位置和画面布局。

十二、ControlNet 和图生图有什么区别？

图生图是让 AI 参考整张图重新生成。

它会参考颜色、风格、内容和结构。

ControlNet 更偏向结构控制。

比如：

只想保留姿势，用 OpenPose
只想保留边缘，用 Canny
只想保留空间，用 Depth
只想保留线稿，用 Lineart

所以 ControlNet 比普通图生图更适合分镜控制。

十三、新手学习 ControlNet 的路线

建议按这个顺序来：

先学基础文生图
再学图生图
学 OpenPose 控制人物姿势
学 Canny 控制轮廓
学 Depth 控制场景空间
学 Lineart 控制线稿
最后尝试多个 ControlNet 组合

不要一开始就多个 ControlNet 叠加。

先把一个类型玩明白，再组合。

十四、使用 ControlNet 的注意事项

给新手几个建议：

参考图越清晰越好
提示词要和参考图一致
控制权重不要一上来拉满
预处理器和模型要匹配
先从单人姿势开始练
复杂场景要分步骤处理
和 LoRA 搭配使用效果更好

ControlNet 不是万能遥控器。

它能提高可控性，但不能替代剧本、分镜和审美判断。

总结

ControlNet 是 AI 漫剧从“随机抽卡”走向“可控创作”的关键工具。

它最核心的价值是：

控制人物姿势
控制镜头构图
控制线稿轮廓
控制场景空间
控制分镜连续性

如果 LoRA 解决的是“角色不像同一个人”，那 ControlNet 解决的就是“画面不按我想的来”。

做 AI 漫剧时，LoRA 和 ControlNet 经常要一起用。

LoRA 负责角色和风格，ControlNet 负责动作和结构，ComfyUI 负责把这些能力串成工作流。

新手可以先从 OpenPose 学起。

只要你能控制人物姿势和基本构图，AI 漫剧的可用画面比例就会明显提升。