创作流程
学习目标:掌握从 idea 到成品的完整 AI 视频创作流程
预计时间:60 分钟
难度:⭐⭐⭐
流程概述
AI 视频创作的完整流程可以分为以下几个阶段:
创意阶段 (1-2 小时)
↓
脚本与故事板 (1-2 小时)
↓
素材准备 (30 分钟 - 1 小时)
↓
AI 生成 (1-3 小时)
↓
后期处理 (2-8 小时)
↓
质量验收与交付 (30 分钟)总计:5-17 小时(根据项目复杂度)
阶段一:创意开发
需求分析
1. 明确项目目标
问题:
- 视频的用途是什么?
• 广告宣传
• 品牌展示
• 产品介绍
• 内容创作
- 目标受众是谁?
• 年龄段:20-30岁、30-50岁等
• 性别:男性、女性、不限
• 兴趣偏好:科技、时尚、生活等
- 传播渠道是什么?
• 平台:抖音、B站、朋友圈、视频号等
• 形式:横屏、竖屏
• 时长:15秒、30秒、60秒等2. 确定项目约束
约束条件:
- 预算限制:时间、成本
- 时长要求:15秒、30秒、60秒等
- 分辨率要求:1080p、4K等
- 风格要求:写实、卡通、电影感等
- 品牌要求:品牌色、Logo位置、品牌调性等
- 合规要求:内容合规、版权合规等创意生成
1. 头脑风暴
方法:
- 快速生成多个创意方向
- 不设限,自由发散
- 数量优先,质量其次
工具:
- AI 辅助:使用 ChatGPT、Claude 等生成创意
- 传统工具:思维导图、白板讨论
- 参考案例:观看同行业优秀案例
示例创意方向:
- 方向1:产品功能展示
- 方向2:生活场景应用
- 方向3:情感化叙事
- 方向4:幽默趣味内容
- 方向5:科技未来感2. 创意筛选
筛选标准:
- 与目标匹配度
- 与受众匹配度
- 可实现性
- 成本可控性
- 差异化程度
筛选方法:
- 团队讨论:集体评估创意方向
- 用户调研:快速验证创意接受度
- A/B 测试:小规模测试不同创意
输出:
- 选出1-2个主创意方向
- 明确每个创意的要点3. 创意细化
细化内容:
- 具体场景设计
- 人物设定(如有)
- 情节发展
- 视觉风格
- 音乐风格
细化方法:
- 故事板:绘制分镜故事板
- 文案:撰写具体文案
- 风格参考:收集风格参考图
- 音乐参考:收集音乐参考
输出:
- 详细的创意方案
- 故事板草图
- 风格和音乐参考阶段二:脚本与故事板
脚本撰写
1. 脚本结构
标准脚本结构:
1. 标题
2. 时长
3. 核心信息
4. 画面描述(分镜头)
5. 文案
6. 音乐建议
示例:
标题:品牌手机广告
时长:30秒
核心信息:产品高性能、拍照清晰、续航持久
镜头1(0-5秒):
画面:特写手机,手指滑动屏幕
文案:快,更快,更流畅
音乐:轻快电子乐
镜头2(5-10秒):
画面:全景,多人用手机拍照,快乐表情
文案:记录每一个精彩瞬间
音乐:高潮音乐
镜头3(10-15秒):
画面:中景,手机在阳光下,展现外观设计
文案:优雅设计,手感舒适
音乐:柔和音乐
镜头4(15-20秒):
画面:特写,手机夜景模式拍照,夜景清晰
文案:夜景模式,依然清晰
音乐:温馨音乐
镜头5(20-25秒):
画面:全景,手机在旅行场景,展现续航
文案:超长续航,陪你走得更远
音乐:激励音乐
镜头6(25-30秒):
画面:产品Logo,品牌标语
文案:[品牌名称] - 定义未来
音乐:品牌音乐2. AI 辅助脚本生成
工具:
- ChatGPT:快速生成脚本初稿
- Claude:优化脚本语言和节奏
- 文心一言:中文脚本优化
提示词示例:
"为[品牌名称]的手机写一个30秒的广告脚本,核心信息是高性能、拍照清晰、续航持久,受众是20-30岁年轻人,风格是科技感、时尚感,需要6个镜头,每个镜头5秒,包含画面描述和文案"
优化方法:
- 生成后人工修改
- 多轮对话优化
- 调整语气和节奏3. 脚本优化
优化要点:
- 节奏:前3秒抓住注意力,中间展示信息,最后强化记忆
- 文案:简洁有力,避免冗长
- 画面:视觉化,避免抽象描述
- 音乐:配合画面,增强情感
优化方法:
- 多次朗读:测试脚本朗读效果
- 模拟演练:模拟实际观看体验
- 朋友反馈:获取客观反馈
输出:
- 优化后的脚本
- 明确的镜头划分
- 画面和音乐的详细描述故事板制作
1. 故事板类型
类型1:简单草图
- 快速绘制每个镜头的草图
- 标注构图、运镜方式
- 标注人物位置、道具等
类型2:详细故事板
- 绘制详细的场景图
- 标注具体时间点
- 标注转场方式
- 标注灯光、色彩等
类型3:AI 故事板
- 使用 AI 生成故事板图像
- 输入脚本,输出故事板
- 快速迭代多个版本2. 故事板制作工具
工具推荐:
- 专业工具:Storyboarder、Toon Boom Storyboard Pro
- 设计软件:Photoshop、Figma、Sketch
- AI 工具:Kling AI、Pika 等 AI 生成工具
使用建议:
- 根据项目复杂度选择工具
- 简单项目:AI 工具快速生成
- 复杂项目:专业工具精确绘制
- 结合使用:AI 快速生成 + 专业工具优化3. 故事板优化
优化要点:
- 构图:每个镜头构图清晰明确
- 流畅:镜头之间衔接自然
- 视觉:整体视觉风格统一
- 时长:每个镜头时长合理
优化方法:
- 团队评审:团队共同评审故事板
- AI 生成:AI 生成多个版本对比
- 参考对比:与优秀案例对比
输出:
- 最终故事板
- 镜头时长表
- 转场方式说明
- 视觉风格说明阶段三:素材准备
视觉素材
1. 角色素材
如需角色:
- 角色设计:绘制或收集角色设计图
- 角色参考:收集角色参考图片
- 角色动作:设计角色动作参考
AI 生成:
- 参考图:使用角色参考图
- 一致性:多次生成保持角色一致
- 多角度:生成不同角度的角色图2. 环境素材
环境参考:
- 地点参考:收集目标地点的参考图片
- 光照参考:收集不同光照的参考图
- 风格参考:收集风格参考图
AI 生成:
- 环境生成:生成不同环境背景
- 风格一致:保持环境风格一致
- 光照一致:保持光照风格一致3. 产品素材
如需产品:
- 产品图片:准备产品多角度图片
- 产品视频:准备产品展示视频(如有)
- 3D 模型:准备产品 3D 模型(如有)
应用:
- 产品展示:在 AI 生成视频中展示产品
- 场景融入:将产品融入 AI 生成场景
- 风格匹配:产品风格与视频风格匹配音频素材
1. 语音素材
AI 语音生成:
- 工具:Suno、Udio、ElevenLabs 等
- 方法:输入脚本,AI 生成语音
- 优化:调整语速、语调、情感
人工配音:
- 专业配音:找专业配音员
- 配音指导:提供配音要求和方向
- 多版配音:生成多个版本对比2. 背景音乐
音乐选择:
- 风格匹配:音乐风格与视频风格匹配
- 节奏匹配:音乐节奏与视频节奏匹配
- 情感匹配:音乐情感与视频情感匹配
来源:
- 音乐库:Epidemic Sound、Artlist、PremiumBeat
- 免费音乐:YouTube Audio Library、Free Music Archive
- AI 生成:Suno、Udio 等 AI 音乐生成3. 音效
音效选择:
- 场景音效:根据场景选择合适音效
- 动作音效:根据动作选择合适音效
- 环境音效:添加环境氛围音效
来源:
- 音效库:Freesound、Freesound Effects、Mixkit
- 音效生成:AI 生成特定音效阶段四:AI 生成
平台选择
1. 根据需求选择
需求映射:
- 电影级制作 → Sora 2
- 专业广告 → Runway Gen-4.5
- Google 生态 → Veo 3.1
- 趣味内容 → Pika 2.0
- 电商/虚拟人 → Kling AI 2.0
- 快速创意 → Pika 2.0 / Kling AI 2.02. 成本考虑
成本对比:
- Sora 2:$10-20(30秒)
- Runway Gen-4.5:$15-30(30秒)
- Veo 3.1:$12-25(30秒)
- Pika 2.0:$5-15(30秒)
- Kling AI 2.0:$3-8(30秒)
选择策略:
- 高预算:Sora 2、Runway Gen-4.5
- 中等预算:Veo 3.1、Runway Gen-4.5
- 低预算:Pika 2.0、Kling AI 2.0生成执行
1. 提示词构建
构建方法:
- 基于脚本:将脚本转换为提示词
- 结构化描述:使用提示词结构
- 权重控制:重要部分加大权重
示例:
根据脚本构建提示词:
"特写镜头,浅景深,侧光照明,暖色调,电影感。一位穿着白色婚纱的25岁新娘,在充满鲜花的教堂里站立,阳光从窗户射入,营造神圣、浪漫的氛围。新娘神情幸福,眼神温柔,双手交叠在胸前。背景是教堂内的鲜花装饰和彩色玻璃窗。"2. 批量生成
生成策略:
- 多版本:一次生成多个版本
- 多平台:同时在不同平台生成
- 多参数:使用不同参数组合
生成数量:
- 每个镜头:生成 3-5 个版本
- 对比选择:人工对比后选择最佳
- 优化迭代:针对问题优化后重新生成3. 质量筛选
筛选标准:
- 脚本符合度:是否符合脚本要求
- 质量评估:视觉质量、物理真实性、一致性
- 技术评估:分辨率、帧率、码率
- 成本评估:是否符合预算要求
筛选方法:
- 人工筛选:团队成员人工观看筛选
- 技术评估:使用专业软件评估
- 团队决策:集体决策最佳版本
输出:
- 每个镜头的最佳版本
- 质量评估报告
- 成本统计问题处理
1. 常见问题识别
常见问题:
- 模糊:画面不清晰
- 伪影:生成算法产生的人工痕迹
- 一致性:角色、场景不一致
- 物理:物理规律不真实
- 时长:不满足时长要求2. 问题解决
解决方法:
- 提示词优化:优化提示词描述
- 参数调整:调整生成参数
- 重新生成:优化后重新生成
- 后期修复:使用后期工具修复
具体方案:
- 模糊问题:提高分辨率、增加"清晰"提示词、后期超分辨率
- 伪影问题:增加"无伪影"负面提示词、后期修复
- 一致性问题:使用参考帧、分段生成拼接
- 物理问题:使用支持物理规则的平台、后期调整
- 时长问题:调整参数、分段生成拼接阶段五:后期处理
剪辑处理
1. 剪辑软件选择
专业软件:
- Premiere Pro:最主流,功能全面
- Final Cut Pro:Mac 平台,性能优秀
- DaVinci Resolve:免费,调色强大
- After Effects:特效强大
轻量软件:
- 剪映:移动端,简单易用
- 必剪:移动端,功能全面
- CapCut:免费,功能不错
选择建议:
- 专业项目:Premiere Pro、DaVinci Resolve
- 中等项目:Final Cut Pro、After Effects
- 轻量项目:剪映、必剪、CapCut2. 剪辑流程
标准流程:
1. 素材导入:导入所有镜头和素材
2. 粗剪:按照脚本拼接镜头
3. 精剪:微调每个镜头的起止点
4. 转场:添加转场效果
5. 调速:调整视频节奏
6. 输出:导出最终视频
技巧:
- 多轨道:使用多轨道组织素材
- 锁定轨道:锁定已完成的轨道
- 快捷键:熟练使用快捷键提高效率
- 自动保存:定时保存避免意外丢失调色处理
1. 调色软件
专业软件:
- DaVinci Resolve:调色功能最强大
- Premiere Pro:内置调色工具
- Final Cut Pro:内置调色功能
调色插件:
- Colorista:强大的调色插件
- Magic Bullet:好莱坞风格调色
- FilmConvert:胶片风格调色2. 调色流程
标准流程:
1. 白平衡:调整白平衡
2. 曝光:调整亮度和对比度
3. 色彩:调整色调和饱和度
4. 曲线:使用曲线微调
5. 风格:应用风格化调色
6. 管理器:使用调色管理器
调色风格:
- 电影感:对比度高,饱和度适中
- 暖色调:色温偏暖
- 冷色调:色温偏冷
- 复古感:降低饱和度,增加噪点音频处理
1. 音频软件
专业软件:
- Audition:专业音频处理
- Pro Tools:专业音频编辑
- Logic Pro:专业音乐制作
轻量软件:
- Audacity:免费开源
- Adobe Audition CC:功能全面
- GarageBand:Mac 平台,简单易用2. 音频处理流程
标准流程:
1. 音频导入:导入语音、音乐、音效
2. 对齐:对齐音频和视频
3. 混音:混合多个音频轨道
4. 音量:调整各轨道音量平衡
5. 效果:添加音频效果(混响、EQ等)
6. 输出:混音后导出
技巧:
- 关键帧:在关键帧标记音频变化
- 分轨处理:语音、音乐、音效分轨道处理
- 监听:多次监听不同设备效果
- 自动化:使用自动化功能提高效率字幕处理
1. 字幕工具
专业软件:
- Subtitle Edit:专业字幕编辑
- Aegisub:开源免费
- 轻量软件:剪映、必剪内置字幕功能
AI 字幕:
- 自动识别:自动识别语音生成字幕
- 翻译:自动翻译字幕
- 语音合成:AI 生成多语言字幕2. 字幕制作流程
标准流程:
1. 自动识别:自动识别语音生成字幕
2. 手动校对:校对字幕文本和时间码
3. 翻译(如需):翻译成目标语言
4. 排版:调整字幕字体、大小、颜色、位置
5. 导出:导出字幕文件(SRT、ASS等)
技巧:
- 分段处理:逐段处理提高准确性
- 参考翻译:使用翻译工具辅助
- 风格统一:保持字幕风格统一
- 测试观看:测试观看效果阶段六:质量验收与交付
质量验收
1. 验收标准
视觉质量:
- 分辨率:达到目标分辨率
- 帧率:达到目标帧率
- 清晰度:画面清晰,无模糊
- 色彩:色彩真实,无偏色
- 噪点:无明显噪点
内容质量:
- 脚本符合:符合脚本要求
- 核心信息:核心信息传达清晰
- 品牌规范:符合品牌规范
- 合规要求:符合内容合规要求
技术质量:
- 文件大小:符合文件大小要求
- 兼容性:目标平台可播放
- 编码标准:符合编码标准2. 验收方法
验收方法:
1. 人工观看:团队成员观看验收
2. 多设备测试:不同设备测试播放
3. 不同网络测试:不同网络环境测试
4. 用户测试:目标用户测试反馈
5. 合规检查:合规部门检查(如需)
验收流程:
- 多轮修改:根据反馈多轮修改
- 最终确认:所有相关方最终确认
- 归档:归档所有版本和修改记录交付
1. 交付格式
视频格式:
- MP4:最通用格式
- MOV:高质量格式
- WebM:网页优化格式
分辨率:
- 1080p:通用高清
- 2K:高清+
- 4K:超高清
音频格式:
- AAC:通用音频编码
- MP3:通用音频格式
- WAV:无损音频格式2. 交付文件
必要文件:
- 最终视频文件
- 字幕文件(如有)
- 项目文件(如需)
附加文件:
- 故事板
- 脚本
- 素材清单
- 制作说明3. 交付方式
交付渠道:
- 云盘:百度网盘、Google Drive、OneDrive
- 传输:WeTransfer、百度网盘传输、FTP
- 平台:直接上传到目标平台
- 现场:现场交付并安装
交付说明:
- 文件说明:说明每个文件的用途
- 使用说明:说明如何使用视频
- 注意事项:重要注意事项本章小结
通过本节学习,你应该掌握了:
✅ 完整创作流程
- 6 个阶段的完整流程
- 每个阶段的具体内容
- 阶段之间的衔接关系
✅ 各阶段方法
- 创意开发方法
- 脚本撰写方法
- 素材准备方法
- AI 生成方法
- 后期处理方法
- 质量验收方法
✅ 工具使用
- 各阶段推荐工具
- 工具选择方法
- 工具使用技巧
✅ 问题处理
- 常见问题识别
- 问题解决方法
- 优化迭代方法
下一步:在下一节中,我们将了解 AI 视频生成在各行业的商业应用案例。
