Skip to content

实践指南

学习目标:掌握 AI 视频生成的提示词设计、工作流程和质量控制方法

预计时间:90 分钟

难度:⭐⭐⭐⭐


提示词设计

提示词的重要性

提示词(Prompt)是你与 AI 视频生成模型沟通的唯一方式。一个好的提示词可以直接决定生成质量。

❌ 差的提示词:
"女孩跳舞"

✅ 好的提示词:
"一个穿着红色连衣裙的年轻女孩,在阳光明媚的花园里优雅地跳舞,镜头是中景,浅景深效果,午后阳光从左上方45度角射入,营造温暖的氛围"

提示词结构

一个优秀的提示词应该包含以下要素:

1. 主体描述 (Subject)
   - 谁/什么:人物、动物、物体等
   - 外观特征:年龄、外貌、穿着、颜色等

2. 动作描述 (Action)
   - 做什么:具体的行为、动作
   - 动作方式:速度、力度、节奏等

3. 环境描述 (Environment)
   - 地点:室内、室外、具体场景
   - 时间:清晨、午后、黄昏等
   - 天气:晴天、阴天、雨天等

4. 视角描述 (Camera)
   - 景别:特写、中景、全景等
   - 运动方式:固定、跟随、推拉等
   - 构图:三分法、中心构图等

5. 风格描述 (Style)
   - 艺术风格:写实、卡通、油画等
   - 渲染风格:电影感、纪录片感等
   - 色调:温暖、冷峻、明快等

提示词优化技巧

1. 分层描述

方法:
- 先描述主体,再描述环境,最后描述风格
- 每层描述用逗号分隔
- 层级清晰,逻辑顺畅

示例:
"一位穿着深蓝色西装的男士,(主体)
站在现代简约风格的办公室里,(环境)
特写镜头,浅景深,(视角)
电影感,冷色调,(风格)"

2. 具体化

方法:
- 避免模糊词汇("很好"、"美丽")
- 使用具体描述("优雅地"、"精致地")
- 添加具体细节(颜色、材质、光照)

示例:
❌ "一个漂亮的女孩跳舞"
✅ "一个穿着红色碎花连衣裙的25岁女孩,在夕阳西下的海滩边轻盈地跳舞"

3. 使用专业术语

专业术语:
- 景别:特写(CU)、中景(MS)、全景(LS)
- 运镜:推镜头(Push)、拉镜头(Pull)、跟镜头(Follow)
- 光照:顺光、侧光、背光、顶光
- 构图:三分法、黄金分割、对称构图
- 色调:暖色调、冷色调、高对比、低对比

示例:
"特写镜头,三分法构图,侧光照明,暖色调,电影感"

4. 负面提示

方法:
- 明确说明不想要什么
- 避免常见的生成问题
- 提高质量标准

示例:
"高质量、8K分辨率、无模糊、无伪影、无失真、专业电影级画质"

5. 权重控制

方法:
- 使用括号或特殊符号控制权重
- 强调重要部分
- 减弱不重要部分

Sora 权重控制:
(主体描述) -- 强化
[环境描述] -- 弱化
((风格描述)) -- 极强

示例:
"(一位穿着白色婚纱的新娘)  在充满鲜花的教堂里  [柔和的烛光]  电影感"

不同平台的提示词特点

平台提示词特点建议
Sora 2中文理解优秀,支持复杂描述详细描述、使用专业术语
Runway Gen-4.5参数化提示使用参数控制、精确描述
Veo 3.1英文提示更好英文提示、详细描述
Pika 2.0风格化提示简洁风格描述、强调风格
Kling AI 2.0中文优化中文提示、人物细节描述

工作流程

完整工作流程

创意阶段
├→ 需求分析
├→ 创意开发
├→ 风格定位
└→ 场景设计

提示词阶段
├→ 结构化提示词
├→ 平台选择
├→ 参数设置
└─── 提示词测试 (快速生成多个版本)

生成阶段
├→ 批量生成
├─── 初步筛选 (人工筛选 2-3 个候选)
├─── 详细优化 (针对候选优化提示词)
├─ 重新生成 (优化后重新生成)
└─── 最终选择 (选出最佳版本)

编辑阶段
├→ 质量检查
├─── 问题修复 (局部编辑、色彩调整)
├─── 剪辑优化 (智能剪切、拼接)
└─── 音频配乐 (语音配音、背景音乐)

交付阶段
├→ 最终导出
├─── 格式转换 (MP4, MOV等)
├─── 分辨率调整 (4K, 1080p等)
└─── 最终检查

阶段详解

1. 创意阶段

需求分析:
- 使用目的:广告、影视、教育等
- 目标受众:年龄、性别、兴趣等
- 传播渠道:抖音、B站、朋友圈等
- 预算限制:时间、成本

创意开发:
- 头脑风暴:快速生成多个创意
- 创意筛选:选择最有潜力的创意
- 创意细化:细化创意的具体细节

风格定位:
- 艺术风格:写实、卡通、电影感等
- 色调风格:温暖、冷峻、明快等
- 节奏风格:快速、缓慢、平稳等

场景设计:
- 环境设计:室内、室外、具体场景
- 光照设计:光源位置、强度、色温
- 运镜设计:景别、运动方式、构图

2. 提示词阶段

结构化提示词:
- 使用前面提到的提示词结构
- 包含所有必要要素
- 逻辑清晰,层次分明

平台选择:
- 根据需求选择平台
- 考虑成本和访问限制
- 评估平台能力匹配度

参数设置:
- 时长设置:15秒、30秒、60秒等
- 分辨率设置:1080p、4K等
- 帧率设置:24fps、30fps、60fps等
- 生成数量:一次生成多个版本

提示词测试:
- 快速生成:快速生成多个版本
- 对比效果:对比不同版本效果
- 选出最佳:选出2-3个最佳候选

3. 生成阶段

批量生成:
- 一次生成多个版本
- 对比不同平台
- 对比不同参数

初步筛选:
- 人工观看所有生成结果
- 评估主体、动作、环境、风格
- 选出2-3个最佳候选

详细优化:
- 分析最佳候选的优点和缺点
- 针对缺点优化提示词
- 微调权重和描述

重新生成:
- 使用优化后的提示词重新生成
- 对比优化前后的效果
- 选出最终版本

最终选择:
- 根据质量和成本综合评估
- 选出最适合的版本
- 进入编辑阶段

4. 编辑阶段

质量检查:
- 逐帧检查:检查每一帧的质量
- 整体检查:检查整体连贯性
- 细节检查:检查细节质量

问题修复:
- 局部编辑:使用 Inpainting 等技术修复问题
- 色彩调整:调整色调、亮度、对比度
- 稳定化:减少抖动、卡顿

剪辑优化:
- 智能剪切:自动识别最佳片段
- 智能拼接:自动拼接多个片段
- 转场效果:添加转场效果

音频配乐:
- 语音配音:AI 生成语音旁白
- 背景音乐:自动匹配背景音乐
- 音效:添加环境音效

5. 交付阶段

最终导出:
- 选择格式:MP4、MOV、WebM等
- 选择编码:H.264、H.265、ProRes等
- 选择质量设置:码率、编码质量

分辨率调整:
- 目标平台:抖音(1080p)、B站(1080p/4K)、朋友圈(1080p)等
- 文件大小:控制文件大小在合理范围
- 兼容性:确保目标平台兼容

最终检查:
- 整体检查:检查最终视频的整体质量
- 细节检查:检查是否有明显问题
- 播放测试:在不同设备上测试播放

质量控制

质量标准

1. 视觉质量

评估指标:
- 清晰度:画面是否清晰,有无模糊
- 细节:细节是否丰富,有无丢失
- 色彩:色彩是否真实,有无偏色
- 对比度:对比度是否合适,有无过曝或欠曝
- 噪点:是否有明显噪点

标准:
- 清晰度:无明显模糊,细节清晰可见
- 细节:重要细节完整保留
- 色彩:色彩自然,无偏色
- 对比度:对比度合适,无过曝或欠曝
- 噪点:无明显噪点

2. 物理真实性

评估指标:
- 运动规律:运动是否符合物理规律
- 光照:光照是否真实,有无不自然
- 交互:物体交互是否真实
- 重力:重力效果是否真实
- 材质:材质表现是否真实

标准:
- 运动规律:运动符合物理规律
- 光照:光照自然,无违和感
- 交互:物体交互真实
- 重力:重力效果自然
- 材质:材质表现真实

3. 一致性

评估指标:
- 时间一致性:时间上是否连续,有无跳跃
- 空间一致性:空间上是否连贯
- 角色一致性:角色外观是否一致
- 场景一致性:场景是否保持一致
- 风格一致性:风格是否保持一致

标准:
- 时间一致性:时间连续,无跳跃
- 空间一致性:空间连贯
- 角色一致性:角色外观一致
- 场景一致性:场景保持一致
- 风格一致性:风格保持一致

质量提升方法

1. 提示词优化

方法:
- 增加质量描述词
- 使用负面提示词
- 调整权重

示例:
"高质量、4K分辨率、电影级画质、专业灯光、无模糊、无失真、8K清晰度"

2. 多轮生成

方法:
- 第一轮:快速生成多个版本
- 第二轮:针对问题优化提示词后重新生成
- 第三轮:针对剩余问题进一步优化

效果:
- 质量逐步提升
- 问题逐步减少

3. 技术后处理

方法:
- 超分辨率:提升分辨率
- 去噪:减少噪点
- 稳定化:减少抖动
- 上色:调整色调、亮度、对比度

工具:
- 传统工具:Premiere、After Effects、DaVinci Resolve
- AI 工具:AI 超分辨率、AI 去噪、AI 上色

常见问题解决

1. 模糊问题

原因:
- 分辨率设置过低
- 生成步数不足
- 噪声过多

解决方法:
- 提高分辨率设置
- 增加生成步数
- 添加"清晰"、"高质量"等提示词
- 后期超分辨率

2. 伪影问题

原因:
- 生成算法问题
- 参数设置不当
- 模型局限性

解决方法:
- 调整生成参数
- 使用负面提示词
- 后期修复
- 重新生成

3. 一致性问题

原因:
- 长视频一致性困难
- 多镜头之间衔接问题
- 角色外观不一致

解决方法:
- 缩短视频时长
- 使用参考帧技术
- 后期编辑修复
- 分段生成后拼接

4. 物理不真实

原因:
- 物理规律学习不足
- 复杂场景推理困难
- 模型局限性

解决方法:
- 使用支持物理规则的平台(Sora 2)
- 简化场景复杂度
- 后期调整
- 重新生成

高级技巧

1. 参考图使用

方法:
- 使用参考图控制风格
- 使用参考图控制构图
- 使用参考图控制角色

应用:
- 图像生视频:参考图生成视频
- 风格迁移:将参考图风格应用到生成视频
- 角色一致:使用角色参考图保持一致性

技巧:
- 参考图清晰度高
- 参考图风格明确
- 参考图构图好

2. 多镜头生成

方法:
- 逐个镜头生成
- 保持角色一致
- 后期拼接

技巧:
- 使用角色参考图
- 保持环境一致
- 镜头衔接平滑
- 风格保持一致

3. 风格融合

方法:
- 多个风格提示词
- 风格权重控制
- 多次生成后融合

技巧:
- 风格描述具体
- 权重调整精确
- 融合后期处理

4. 批量生成策略

方法:
- 参数矩阵:设计参数组合
- 批量生成:一次生成多个版本
- 智能筛选:自动筛选最佳版本

技巧:
- 参数设计合理
- 生成数量适中
- 筛选标准明确

本章小结

通过本节学习,你应该掌握了:

提示词设计

  • 提示词的重要性
  • 提示词的结构
  • 提示词的优化技巧
  • 不同平台的提示词特点

工作流程

  • 完整的 5 阶段工作流程
  • 每个阶段的具体内容
  • 各阶段的衔接关系

质量控制

  • 质量评估标准
  • 质量提升方法
  • 常见问题解决方案

高级技巧

  • 参考图使用方法
  • 多镜头生成策略
  • 风格融合技巧
  • 批量生成策略

下一步:在下一节中,我们将学习从 idea 到成品的完整创作流程。


← 返回章节目录 | 继续学习:创作流程 →

最近更新

基于 MIT LICENSE 许可发布