实践指南

学习目标：掌握 AI 视频生成的提示词设计、工作流程和质量控制方法
预计时间：90 分钟
难度：⭐⭐⭐⭐

提示词设计

提示词的重要性

提示词（Prompt）是你与 AI 视频生成模型沟通的唯一方式。一个好的提示词可以直接决定生成质量。

❌ 差的提示词：
"女孩跳舞"

✅ 好的提示词：
"一个穿着红色连衣裙的年轻女孩，在阳光明媚的花园里优雅地跳舞，镜头是中景，浅景深效果，午后阳光从左上方45度角射入，营造温暖的氛围"

提示词结构

一个优秀的提示词应该包含以下要素：

1. 主体描述 (Subject)
   - 谁/什么：人物、动物、物体等
   - 外观特征：年龄、外貌、穿着、颜色等

2. 动作描述 (Action)
   - 做什么：具体的行为、动作
   - 动作方式：速度、力度、节奏等

3. 环境描述 (Environment)
   - 地点：室内、室外、具体场景
   - 时间：清晨、午后、黄昏等
   - 天气：晴天、阴天、雨天等

4. 视角描述 (Camera)
   - 景别：特写、中景、全景等
   - 运动方式：固定、跟随、推拉等
   - 构图：三分法、中心构图等

5. 风格描述 (Style)
   - 艺术风格：写实、卡通、油画等
   - 渲染风格：电影感、纪录片感等
   - 色调：温暖、冷峻、明快等

提示词优化技巧

1. 分层描述

方法：
- 先描述主体，再描述环境，最后描述风格
- 每层描述用逗号分隔
- 层级清晰，逻辑顺畅

示例：
"一位穿着深蓝色西装的男士，(主体)
站在现代简约风格的办公室里，(环境)
特写镜头，浅景深，(视角)
电影感，冷色调，(风格)"

2. 具体化

方法：
- 避免模糊词汇（"很好"、"美丽"）
- 使用具体描述（"优雅地"、"精致地"）
- 添加具体细节（颜色、材质、光照）

示例：
❌ "一个漂亮的女孩跳舞"
✅ "一个穿着红色碎花连衣裙的25岁女孩，在夕阳西下的海滩边轻盈地跳舞"

3. 使用专业术语

专业术语：
- 景别：特写(CU)、中景(MS)、全景(LS)
- 运镜：推镜头(Push)、拉镜头(Pull)、跟镜头(Follow)
- 光照：顺光、侧光、背光、顶光
- 构图：三分法、黄金分割、对称构图
- 色调：暖色调、冷色调、高对比、低对比

示例：
"特写镜头，三分法构图，侧光照明，暖色调，电影感"

4. 负面提示

方法：
- 明确说明不想要什么
- 避免常见的生成问题
- 提高质量标准

示例：
"高质量、8K分辨率、无模糊、无伪影、无失真、专业电影级画质"

5. 权重控制

方法：
- 使用括号或特殊符号控制权重
- 强调重要部分
- 减弱不重要部分

Sora 权重控制：
(主体描述) -- 强化
[环境描述] -- 弱化
((风格描述)) -- 极强

示例：
"(一位穿着白色婚纱的新娘)  在充满鲜花的教堂里  [柔和的烛光]  电影感"

不同平台的提示词特点

平台	提示词特点	建议
Sora 2	中文理解优秀，支持复杂描述	详细描述、使用专业术语
Runway Gen-4.5	参数化提示	使用参数控制、精确描述
Veo 3.1	英文提示更好	英文提示、详细描述
Pika 2.0	风格化提示	简洁风格描述、强调风格
Kling AI 2.0	中文优化	中文提示、人物细节描述

工作流程

完整工作流程

创意阶段
├→ 需求分析
├→ 创意开发
├→ 风格定位
└→ 场景设计

提示词阶段
├→ 结构化提示词
├→ 平台选择
├→ 参数设置
└─── 提示词测试 (快速生成多个版本)

生成阶段
├→ 批量生成
├─── 初步筛选 (人工筛选 2-3 个候选)
├─── 详细优化 (针对候选优化提示词)
├─ 重新生成 (优化后重新生成)
└─── 最终选择 (选出最佳版本)

编辑阶段
├→ 质量检查
├─── 问题修复 (局部编辑、色彩调整)
├─── 剪辑优化 (智能剪切、拼接)
└─── 音频配乐 (语音配音、背景音乐)

交付阶段
├→ 最终导出
├─── 格式转换 (MP4, MOV等)
├─── 分辨率调整 (4K, 1080p等)
└─── 最终检查

阶段详解

1. 创意阶段

需求分析：
- 使用目的：广告、影视、教育等
- 目标受众：年龄、性别、兴趣等
- 传播渠道：抖音、B站、朋友圈等
- 预算限制：时间、成本

创意开发：
- 头脑风暴：快速生成多个创意
- 创意筛选：选择最有潜力的创意
- 创意细化：细化创意的具体细节

风格定位：
- 艺术风格：写实、卡通、电影感等
- 色调风格：温暖、冷峻、明快等
- 节奏风格：快速、缓慢、平稳等

场景设计：
- 环境设计：室内、室外、具体场景
- 光照设计：光源位置、强度、色温
- 运镜设计：景别、运动方式、构图

2. 提示词阶段

结构化提示词：
- 使用前面提到的提示词结构
- 包含所有必要要素
- 逻辑清晰，层次分明

平台选择：
- 根据需求选择平台
- 考虑成本和访问限制
- 评估平台能力匹配度

参数设置：
- 时长设置：15秒、30秒、60秒等
- 分辨率设置：1080p、4K等
- 帧率设置：24fps、30fps、60fps等
- 生成数量：一次生成多个版本

提示词测试：
- 快速生成：快速生成多个版本
- 对比效果：对比不同版本效果
- 选出最佳：选出2-3个最佳候选

3. 生成阶段

批量生成：
- 一次生成多个版本
- 对比不同平台
- 对比不同参数

初步筛选：
- 人工观看所有生成结果
- 评估主体、动作、环境、风格
- 选出2-3个最佳候选

详细优化：
- 分析最佳候选的优点和缺点
- 针对缺点优化提示词
- 微调权重和描述

重新生成：
- 使用优化后的提示词重新生成
- 对比优化前后的效果
- 选出最终版本

最终选择：
- 根据质量和成本综合评估
- 选出最适合的版本
- 进入编辑阶段

4. 编辑阶段

质量检查：
- 逐帧检查：检查每一帧的质量
- 整体检查：检查整体连贯性
- 细节检查：检查细节质量

问题修复：
- 局部编辑：使用 Inpainting 等技术修复问题
- 色彩调整：调整色调、亮度、对比度
- 稳定化：减少抖动、卡顿

剪辑优化：
- 智能剪切：自动识别最佳片段
- 智能拼接：自动拼接多个片段
- 转场效果：添加转场效果

音频配乐：
- 语音配音：AI 生成语音旁白
- 背景音乐：自动匹配背景音乐
- 音效：添加环境音效

5. 交付阶段

最终导出：
- 选择格式：MP4、MOV、WebM等
- 选择编码：H.264、H.265、ProRes等
- 选择质量设置：码率、编码质量

分辨率调整：
- 目标平台：抖音(1080p)、B站(1080p/4K)、朋友圈(1080p)等
- 文件大小：控制文件大小在合理范围
- 兼容性：确保目标平台兼容

最终检查：
- 整体检查：检查最终视频的整体质量
- 细节检查：检查是否有明显问题
- 播放测试：在不同设备上测试播放

质量控制

质量标准

1. 视觉质量

评估指标：
- 清晰度：画面是否清晰，有无模糊
- 细节：细节是否丰富，有无丢失
- 色彩：色彩是否真实，有无偏色
- 对比度：对比度是否合适，有无过曝或欠曝
- 噪点：是否有明显噪点

标准：
- 清晰度：无明显模糊，细节清晰可见
- 细节：重要细节完整保留
- 色彩：色彩自然，无偏色
- 对比度：对比度合适，无过曝或欠曝
- 噪点：无明显噪点

2. 物理真实性

评估指标：
- 运动规律：运动是否符合物理规律
- 光照：光照是否真实，有无不自然
- 交互：物体交互是否真实
- 重力：重力效果是否真实
- 材质：材质表现是否真实

标准：
- 运动规律：运动符合物理规律
- 光照：光照自然，无违和感
- 交互：物体交互真实
- 重力：重力效果自然
- 材质：材质表现真实

3. 一致性

评估指标：
- 时间一致性：时间上是否连续，有无跳跃
- 空间一致性：空间上是否连贯
- 角色一致性：角色外观是否一致
- 场景一致性：场景是否保持一致
- 风格一致性：风格是否保持一致

标准：
- 时间一致性：时间连续，无跳跃
- 空间一致性：空间连贯
- 角色一致性：角色外观一致
- 场景一致性：场景保持一致
- 风格一致性：风格保持一致

质量提升方法

1. 提示词优化

方法：
- 增加质量描述词
- 使用负面提示词
- 调整权重

示例：
"高质量、4K分辨率、电影级画质、专业灯光、无模糊、无失真、8K清晰度"

2. 多轮生成

方法：
- 第一轮：快速生成多个版本
- 第二轮：针对问题优化提示词后重新生成
- 第三轮：针对剩余问题进一步优化

效果：
- 质量逐步提升
- 问题逐步减少

3. 技术后处理

方法：
- 超分辨率：提升分辨率
- 去噪：减少噪点
- 稳定化：减少抖动
- 上色：调整色调、亮度、对比度

工具：
- 传统工具：Premiere、After Effects、DaVinci Resolve
- AI 工具：AI 超分辨率、AI 去噪、AI 上色

常见问题解决

1. 模糊问题

原因：
- 分辨率设置过低
- 生成步数不足
- 噪声过多

解决方法：
- 提高分辨率设置
- 增加生成步数
- 添加"清晰"、"高质量"等提示词
- 后期超分辨率

2. 伪影问题

原因：
- 生成算法问题
- 参数设置不当
- 模型局限性

解决方法：
- 调整生成参数
- 使用负面提示词
- 后期修复
- 重新生成

3. 一致性问题

原因：
- 长视频一致性困难
- 多镜头之间衔接问题
- 角色外观不一致

解决方法：
- 缩短视频时长
- 使用参考帧技术
- 后期编辑修复
- 分段生成后拼接

4. 物理不真实

原因：
- 物理规律学习不足
- 复杂场景推理困难
- 模型局限性

解决方法：
- 使用支持物理规则的平台（Sora 2）
- 简化场景复杂度
- 后期调整
- 重新生成

高级技巧

1. 参考图使用

方法：
- 使用参考图控制风格
- 使用参考图控制构图
- 使用参考图控制角色

应用：
- 图像生视频：参考图生成视频
- 风格迁移：将参考图风格应用到生成视频
- 角色一致：使用角色参考图保持一致性

技巧：
- 参考图清晰度高
- 参考图风格明确
- 参考图构图好

2. 多镜头生成

方法：
- 逐个镜头生成
- 保持角色一致
- 后期拼接

技巧：
- 使用角色参考图
- 保持环境一致
- 镜头衔接平滑
- 风格保持一致

3. 风格融合

方法：
- 多个风格提示词
- 风格权重控制
- 多次生成后融合

技巧：
- 风格描述具体
- 权重调整精确
- 融合后期处理

4. 批量生成策略

方法：
- 参数矩阵：设计参数组合
- 批量生成：一次生成多个版本
- 智能筛选：自动筛选最佳版本

技巧：
- 参数设计合理
- 生成数量适中
- 筛选标准明确

本章小结

通过本节学习，你应该掌握了：

✅ 提示词设计

提示词的重要性
提示词的结构
提示词的优化技巧
不同平台的提示词特点

✅ 工作流程

完整的 5 阶段工作流程
每个阶段的具体内容
各阶段的衔接关系

✅ 质量控制

质量评估标准
质量提升方法
常见问题解决方案

✅ 高级技巧

参考图使用方法
多镜头生成策略
风格融合技巧
批量生成策略

下一步：在下一节中，我们将学习从 idea 到成品的完整创作流程。

← 返回章节目录 | 继续学习：创作流程 →

实践指南 ​

提示词设计 ​

提示词的重要性 ​

提示词结构 ​

提示词优化技巧 ​

不同平台的提示词特点 ​

工作流程 ​

完整工作流程 ​

阶段详解 ​

质量控制 ​

质量标准 ​

质量提升方法 ​

常见问题解决 ​

高级技巧 ​

1. 参考图使用 ​

2. 多镜头生成 ​

3. 风格融合 ​

4. 批量生成策略 ​

本章小结 ​