Skip to content

主流平台详解

学习目标:深入了解 Midjourney、DALL-E 3、Adobe Firefly、Stable Diffusion 3 / FLUX 四大主流 AI 绘画平台的核心特性、优劣势和适用场景

预计时间:50 分钟

难度:⭐⭐


平台选型的重要性

选择正确的平台往往比掌握复杂的提示词技巧更重要。当前的 AI 绘画市场呈现出"术业有专攻"的特性——每个平台都有自己最擅长的领域和最适用的场景:

平台一句话定位最擅长
Midjourney艺术美感的极致追求者创意概念、广告视觉、艺术设计
DALL-E 3最精准的提示词理解者快速原型、插画、教育内容
Adobe Firefly版权安全的商业设计助手商业设计、品牌物料、企业级应用
Stable Diffusion / FLUX完全可控的开源自由派自定义部署、批量生成、精细化控制

选型建议

如果你是初次接触 AI 绘画,建议从 Midjourney 或通义万相开始,体验最佳的开箱即用效果。如果你有明确的商业化需求,重点关注 Adobe Firefly 的版权安全性。如果你是开发者或技术爱好者,Stable Diffusion 和 FLUX 的开源生态将给你最大的自由度。


1. Midjourney

一句话定位

Midjourney 是当前 AI 绘画领域艺术美感最强的平台,以其独特的审美风格和极高的图像质量,成为创意设计师的首选工具。

核心能力

最新版本:V8 Alpha(2026 年 3 月)

Midjourney V8 Alpha 是迄今为止最大的一次版本更新,建立在全新的 GPU 原生代码基础上:

  • 5 倍速度提升:单张图像生成从 V7 的 30-60 秒降至 10 秒以内
  • 原生 2K 分辨率:通过 --hd 参数直接输出原生 2K 图像,无需额外放大步骤
  • 实时模式:V8.1 Alpha(2026 年 4 月)已将 HD 模式设为默认,原生 2K 图像无需显式 upscale
  • 改进的文本渲染:引号内的文字字符串在图像中渲染更可靠
  • 更好的提示词理解:复杂多元素提示词的跟随精度显著提升
  • Style Creator:从参考图像中提取可复用的视觉风格,生成可分享的风格代码

版本演进

版本发布时间核心改进
V6.12024 年 7 月图像连贯性、提示词理解、文本渲染初步改进
V72025 年 6 月新架构、默认模型,显著提升质量和一致性和个性化能力
V8 Alpha2026 年 3 月全新 GPU 原生代码、5 倍速度、原生 2K 分辨率
V8.1 Alpha2026 年 4 月默认 HD 模式,原生 2K 无需显式放大
Niji 72026 年 1 月动漫/二次元风格专用模型

交互方式

Midjourney 最初完全基于 Discord 运行,但从 2025 年开始提供了完整的 Web 界面:

  • Discord 命令:传统方式,在 Discord 服务器中使用 /imagine 等斜杠命令
  • Web UI:访问 midjourney.com 使用完整功能的 Web 界面,Discord 已变为可选
  • Alpha 版本alpha.midjourney.com 提供了 V8 Alpha 的访问入口

参数系统

Midjourney 拥有最丰富的参数体系,允许用户精细控制生成结果:

参数全称作用常用值
--arAspect Ratio宽高比16:9, 4:3, 1:1, 9:16
--s / --stylizeStylize风格化强度0-1000(默认 100)
--c / --chaosChaos结果多样性0-100
--vVersion模型版本6.1, 7, 8
--iwImage Weight参考图权重0.5-2.0(图生图时)
--noNegative Prompt排除元素--no text, watermarks
--crefCharacter Reference角色一致性参考图像 URL
--srefStyle Reference风格一致性参考图像 URL
--p / --personalizePersonalization个性化风格启用/禁用
--hdHD Mode原生 2K 输出V8 专用,消耗 4 倍额度
--q 4Quality 4增强连贯性复杂场景专用,消耗 4 倍额度
--weirdWeird创意怪异度0-3000
--rawRaw Mode减少 Midjourney 风格干预启用/禁用

特色功能

  • Blend(混合):将 2-5 张图像混合,融合各自视觉特征
  • Describe(描述):上传图像让 AI 反推提示词("以图生文")
  • Pan / Reframe(平移/重新构图):延展画布任意方向,自动补全新内容
  • Character Reference(角色参考):使用 --cref 参数,跨图像保持角色面部和服装一致
  • Style Reference(风格参考):使用 --sref 参数,将参考图像的风格应用于新生成
  • Moodboard(情绪板):V8 新增,组合多张参考图像进行风格融合

定价方案(2026 年 4 月)

套餐月付年付(折合月付)快速 GPU 时长Relax 模式隐身模式适用人群
Basic$10$83.3 小时(约 200 张)爱好者
Standard$30$2415 小时(约 900 张)无限设计师
Pro$60$4830 小时(约 1800 张)无限代理/客户工作
Mega$120$9660 小时(约 3600 张)无限高产工作室
  • 年付可节省 20%
  • 所有付费套餐均包含 商业使用权
  • 年营收超过 100 万美元的企业必须使用 Pro 或 Mega 套餐
  • 额外 GPU 时间:$4/小时
  • 无免费版:免费版已于 2024 年底停用

Premium 功能消耗

V8 的部分高级功能消耗更多计算资源:

功能消耗倍数速度影响
标准生成1x基准
--hd(2K 分辨率)4x比标准慢 4 倍
--q 4(增强连贯性)4x比标准慢 4 倍
风格参考 --sref4x比标准慢 4 倍
情绪板参考4x比标准慢 4 倍

优势与局限

优势局限
最佳美学质量:艺术感和构图能力无人能及无免费版:最低 $10/月
活跃社区:Discord 和 Web 社区创作氛围浓厚无公开 API:企业 API 需邀请
持续快速更新:V8 的重写彰显长期投入文字渲染仍不完美:虽然 V8 改进,但仍不如 DALL-E 3
商业授权友好:所有付费套餐皆含封闭生态:无法像 SD 那样深度定制
个性化系统--p 参数可学习个人审美偏好隐私有限:需要隐身模式(Pro 以上)

适用场景

  • 创意概念设计:游戏角色、电影场景、建筑前期概念
  • 广告视觉:品牌海报、社交媒体创意内容
  • 艺术设计:插画、数字艺术、平面设计
  • 灵感获取:快速生成多个创意方向供参考

快速上手

text
1. 访问 midjourney.com 注册账号(需付费套餐)
2. 选择 Standard 或 Pro 套餐(建议 Standard 起步)
3. 进入 Web UI 或加入 Discord 服务器
4. 输入你的第一个提示词:
   /imagine prompt: a serene mountain landscape at sunset, cinematic lighting, --ar 16:9 --v 8
5. 使用 U1-U4 放大图像,V1-V4 生成变体
6. 使用 --sref 或 --cref 探索风格/角色控制

新手提示

Midjourney 的 Web UI 比 Discord 更适合初学者,界面更直观。但 Discord 社区的氛围和分享机制仍然是 Midjourney 体验的重要组成部分。建议 Web UI 创作 + Discord 社区学习的双通道使用方式。


2. DALL-E 3

一句话定位

DALL-E 3 是提示词理解最精准的 AI 绘画平台,能够以极高的忠实度执行复杂的文本描述,特别擅长在图像中嵌入文字。

核心能力

集成方式

DALL-E 3 由 OpenAI 开发,深度集成在 ChatGPT 生态中:

  • ChatGPT 集成:通过对话界面直接生成图片,支持多轮编辑
  • API 接口:提供标准 API(已于 2026 年 5 月 12 日停止服务
  • 技术架构:自回归图像合成,原生构建在 ChatGPT / GPT-4o 基础设施之上

API 已停用

OpenAI 于 2026 年 5 月 12 日停止了 DALL-E 3 API 服务。开发者需要迁移到 FLUX、Stable Diffusion 3.5 或 ModelsLab 等替代方案。ChatGPT 内的图像生成功能不受影响。

核心技术优势

  • 文字渲染能力:DALL-E 3 是目前在图像中渲染文字最可靠的模型——标签、标志、海报文字等都能准确呈现
  • 复杂指令遵循:能够理解并执行包含多个对象、位置关系、属性描述的复杂提示词
  • ChatGPT 提示词优化:GPT-4 自动优化用户提示词后再传给 DALL-E 3,大幅提升生成质量
  • HD 质量模式:可选 "vivid"(超现实、电影感,ChatGPT 默认)和 "natural"(写实、摄影风)
  • 多轮对话编辑:在 ChatGPT 中通过对话进行局部重绘(Inpainting),无需手动遮罩

支持尺寸

尺寸比例
1024×10241:1 正方形
1024×17929:16 竖版(最适合社交媒体故事/海报)
1792×102416:9 横版(最适合封面/演示)

局限性

  • 严格的内容政策:拒绝生成公众人物、在世艺术家风格、暴力/成人内容
  • 风格控制有限:无法像 Midjourney 的 --sref 或 SD 的 LoRA 那样精细控制风格
  • 无变异/图生图 API:API 不支持生成变体或图像到图像的操作
  • API 已停用(2026 年 5 月 12 日),开发者需寻找替代方案
  • 作为独立工具能力有限:离开了 ChatGPT 对话界面,DALL-E 3 的编辑和迭代体验大打折扣

定价方案

访问方式价格生成限额
ChatGPT 免费版$0/月每天 2 张图像
ChatGPT Plus$20/月无限量(含 GPT-4o、数据分析等)
ChatGPT Team$25/人/月无限量(含团队协作功能)
ChatGPT Enterprise自定义无限量 + 企业级管理

优势与局限

优势局限
最佳提示词理解:复杂指令忠实执行API 已停用:不再适用于开发集成
最佳文字渲染:图像中文字最可靠风格控制弱:无法精细调整风格
ChatGPT 深度集成:对话式编辑体验流畅内容政策严格:创作自由度受限
免费可用:每天 2 张,零成本入门独立性弱:离开 ChatGPT 功能减半
提示词自动优化:GPT-4 自动润色描述输出尺寸有限:最大 1792×1024

适用场景

  • 快速原型:产品概念、UI/UX 方案快速可视化
  • 插画创作:绘本、儿童书籍、科普插图
  • 教育内容:教学插图、信息图表、知识可视化
  • 社交媒体:封面图、配图、含文字的传播内容
  • 故事板:分镜设计、场景概念速写

快速上手

text
1. 访问 chat.openai.com 注册账号
2. 免费用户每天 2 次,Plus 用户无限量
3. 在聊天框中输入描述(支持中文):
   "请生成一张海报,主题是夏日水果茶,主视觉为玻璃杯装的水果茶,
   杯中有柠檬片、草莓和薄荷叶,背景是温暖的阳光和木质桌面。
   在海报下方显示文字'夏日限定·清爽一夏'"
4. 如不满意,可在对话中进一步修改:
   "把背景换成渐变粉色,文字改成金色"
5. 使用 vivid(生动)或 natural(自然)模式切换风格取向

提示词技巧

DALL-E 3 最适合具象、细节丰富的描述。不需要写 MJ 式的艺术词汇,清晰地说出"画面里有什么、什么颜色、什么位置、什么风格"即可。GPT-4 会自动把你的描述优化成 DALL-E 3 能最佳理解的格式。


3. Adobe Firefly

一句话定位

Adobe Firefly 是版权最安全的 AI 绘画平台,其训练数据基于 Adobe Stock 等经过授权的图像,适合商业和企业级应用。

核心能力

产品定位

Adobe 将 Firefly 定位为"一站式创意 AI 工作室",不仅仅是一个图像生成工具,而是 Adobe 整个生态系统(Photoshop、Premiere Pro、Illustrator、Express、Acrobat)的 AI 能力内核。

集成生态

Firefly 最独特的优势在于与 Adobe 专业设计工具的深度集成:

工具集成方式核心功能
Photoshop内置 Generative Fill局部填充、扩展、去除对象、参考图支持
Illustrator矢量图形 AI 增强文本到矢量图形、颜色方案生成
Express快速设计模板AI 辅助社交媒体内容、海报、传单创作
Premiere Pro视频 AI 编辑Quick Cut、音频增强、色彩调整
AcrobatPDF 文档处理AI 视觉内容增强
Figma插件设计稿 AI 图像生成

30+ 合作伙伴模型生态

Firefly 最大的亮点之一是其开放的模型选择策略——用户不再只能使用 Adobe 自家的模型,而是可以从 30+ 合作伙伴模型中选择:

  • Adobe 版权安全 Firefly 模型
  • Google Nano Banana 2 & Veo 3.1
  • OpenAI GPT Image Generation / GPT Image 2
  • Runway Gen-4.5
  • Black Forest Labs FLUX.2 [pro]
  • Kling 3.0 & Kling 3.0 Omni
  • Luma AI Ray3.14
  • ElevenLabs Multilingual v2
  • Topaz Lab Topaz Astra

Firefly AI Assistant(2026 年 4 月公开测试版)

Firefly AI Assistant 是 Adobe 最具野心的 AI 功能,能够:

  • 跨 Photoshop、Premiere、Firefly 等工具编排多步骤工作流
  • 访问 60+ 专业级工具
  • 执行"从图库选一张图 → 用 AI 扩展画布 → 添加文字 → 导出为海报"等连贯操作

图像编辑功能(2026 年 3 月更新)

功能描述
Generative Fill(生成式填充)添加、替换或优化元素,结果符合上下文语境
Generative Remove(生成式移除)快速消除不需要的物体
Generative Expand(生成式扩展)无缝适应图像到新的尺寸和比例
Generative Upscale(生成式放大)提高分辨率,锐化细节
Remove Background(移除背景)一键抠图
Precision Flow(精确流)滑块式浏览同一提示词的多个变体
AI Markup(AI 标记)直接在图像上用画笔/矩形绘制指定区域

2026 年 Photoshop Generative Fill 更新

  • 重新设计的界面,支持参考图像
  • 上下文任务栏中的模型选择器
  • 默认模型:Firefly Fill & Expand
  • 合作伙伴模型:Gemini 3 (Nano Banana Pro)、FLUX.2 pro
  • 界面内可实时查看 AI 信用余额

版权优势

Firefly 最大的差异化优势是其版权安全性

  • 训练数据基于 Adobe Stock 授权内容和公开领域内容
  • 为商业使用设计的版权保障框架
  • Adobe 对生成的图像提供版权赔偿保护(针对付费用户)
  • 特别适合品牌物料、广告投放、企业级设计等对版权敏感的场景

定价方案

套餐月费特点
免费版$0有限生成次数,基础功能
Firefly Premium~$5-10/月更多生成额度,AI 标记等功能
Creative Cloud 含 Firefly$5-55/月取决于 CC 套餐,含深度集成功能
Photoshop 网页版 (免费)$020 次免费 Generative Fill
Photoshop 网页版 (付费)套餐内含无限次 Generative Fill

2026 年 2 月起,Firefly 推出了无限生成推广,付费用户可使用行业领先模型(Google Nano Banana Pro、GPT Image Generation、Runway Gen-4 Image、Adobe Firefly 模型)无限生成,且支持 2K 分辨率。

优势与局限

优势局限
版权最安全:授权训练数据 + 版权赔偿独立使用体验中等:最佳体验需 Adobe 生态
Photoshop 深度集成:专业设计师无缝衔接学习曲线:要善用 Firefly,最好熟悉 Adobe 工具
30+ 模型选择:自由切换不同 AI 模型生成质量:部分场景不及 Midjourney 的艺术性
企业级功能:团队协作、品牌资产管理高价套餐:完整功能需 CC 订阅,费用较高
AI Assistant:跨应用自动化工作流独立网页版功能有限:高级功能需下载软件

适用场景

  • 商业设计:品牌 VI、企业宣传物料、产品包装
  • 商业化敏感的版权项目:广告投放、电商主图、出版物
  • Photoshop 用户增效:在现有设计工作流中嵌入 AI 能力
  • 照片编辑和后期:扩展画布、移除物体、智能填充
  • 批量营销素材:广告创意的快速多版本生成

快速上手

text
1. 访问 firefly.adobe.com 免费注册(可用 Google/Apple ID 登录)
2. 首次使用:免费体验 Text to Image
3. 输入提示词(支持中文):
   "A modern minimalist living room with large windows, 
    warm natural light, beige sofa, green plants, 
    wooden floor, bright and airy atmosphere"
4. 使用 Precision Flow 滑块浏览同一提示词的多个变体
5. 如需编辑:将图像发送到 Photoshop,使用 Generative Fill
6. 尝试 AI Markup:在图像上画一个矩形,输入 "a vase of flowers"
7. 进阶:在 Photoshop 中使用 Reference Image 功能控制生成方向

Firefly 的独特价值

如果你已经在使用 Adobe Creative Cloud,Firefly 是最自然的选择——它不只是一个独立的生成工具,而是嵌入到 Photoshop、Illustrator 等工作流程中的 AI 能力。对于纯图像生成,Midjourney 可能质量更高;但对于"生成后还需要编辑加工"的专业工作流,Firefly 的集成优势无可替代。


4. Stable Diffusion 3 / FLUX

一句话定位

Stable Diffusion 和 FLUX 代表了 AI 绘画的"开源自由派"——它们提供最大化的控制自由度和定制能力,让技术用户能够做到商业平台无法实现的事情。

背景:两脉同源

Stable Diffusion 和 FLUX 有着共同的基因——FLUX 的创始团队正是 Stable Diffusion 核心算法的原始创建者:

维度Stability AI(SD 3.5)Black Forest Labs(FLUX.2)
成立时间2020 年2024 年
总部伦敦,英国弗莱堡,德国
创始人Emad Mostaque(原 CEO)Robin Rombach、Andreas Blattmann 等
核心贡献Stable Diffusion 系列普及化SD 核心算法的原始创建者
模型架构MMDiT(Multi-Modal DiT)Latent Flow Matching + Mistral VLM
开源理念开源权重,限制性许可证分层开源,Apache 2.0 / 非商业 / 商业
2026 最新SD 3.5 Medium/LargeFLUX.2 [pro]/[flex]/[dev]/[klein]

FLUX.2 模型家族(2025 年 11 月)

FLUX.2 是一个生产级图像生成和编辑系统,核心特性包括:

  • 多参考编辑:同时参考最多 10 张图像
  • 精确色彩控制:指定精确的颜色值
  • 结构化提示词:支持结构化输入格式
  • 最高 4MP 输出:四百万像素级别的输出
  • 角色和风格一致性:跨参考图像保持一致性
  • 文字渲染准确率:92%(复杂布局)
  • 空间关系错误率:降低 37%
模型参数量许可证最适合
FLUX.2 [pro]-商业 API生产环境,最高质量
FLUX.2 [flex]-商业 API开发者控制,可调步数和引导强度
FLUX.2 [dev]32B非商业(开源权重)研究、微调
FLUX.2 [klein] 4B4BApache 2.0本地部署、亚秒级推理、消费级 GPU
FLUX.2 [klein] 9B9B非商业更高质量的本地部署

FLUX.2 [klein] 的历史意义

2026 年 1 月发布的 FLUX.2 [klein] 4B 模型,仅需约 8GB VRAM(RTX 3090/4070+),即可在消费级显卡上实现亚秒级图像生成。它还将文生图、单参考编辑、多参考编辑集成到一个模型中,并以 Apache 2.0 协议开源。这意味着:你可以在自己的电脑上毫秒级生成高质量图像,完全不需要联网,也无需支付任何 API 费用。

Stable Diffusion 3.5 模型家族

SD 3.5 是 Stability AI 的最新版本,采用 MMDiT(Multi-Modal Diffusion Transformer)架构:

模型参数量VRAM 需求特点
SD 3.5 Medium~2B9.9GB专为消费级硬件设计
SD 3.5 Large~8B>12GB最强的提示词遵循能力和质量
SD 3.5 Large Turbo~8B(蒸馏版)>12GB蒸馏加速,速度更快
  • 开放权重(社区许可证)
  • SD 3.5 Large 已有 ControlNet 支持
  • 自托管、本地定制、构建者优先工作流的最佳选择

生态对比:FLUX vs Stable Diffusion

维度FLUXStable Diffusion
图像质量当前最佳(pro 模型)优秀,但略逊 FLUX
文字渲染优秀(92% 准确率)良好
提示词遵循流匹配架构,非常优秀MMDiT,表现良好
照片级真实感两者均优秀两者均优秀
社区生态较新,快速成长中成熟,LoRA/检查点最丰富
开源程度分层开源权重更开放
商业 API明确的费率卡,生产就绪Stable Image Ultra/Core
本地速度klein 4B 亚秒级需要更高配置
微调生态LoRA 支持已就绪最大规模的 LoRA 生态系统

Sub-second 推理

FLUX.2 [klein] 4B 的发布标志着 AI 绘画进入"实时生成"时代:

  • 单张图像生成时间 < 1 秒(消费级 GPU)
  • 仅需约 8GB VRAM(RTX 3090/4070+)
  • Apache 2.0 许可证,完全自由使用
  • 文生图、单参考编辑、多参考编辑三合一

这意味着用户可以做到:

text
原本的流程(SD 1.5/XL):
输入提示词 → 等待 3-10 秒 → 查看结果 → 不满意 → 修改提示词 → 再等 3-10 秒

FLUX.2 [klein] 的流程:
输入提示词 → 不到 1 秒出图 → 不满意 → 修改 → 再不到 1 秒出图
(迭代速度提升了 10 倍,创作体验从"等待"变成"互动")

优势与局限

优势局限
最大化控制:参数、模型、流程完全自由需要技术基础:搭建 ComfyUI、配置环境有一定门槛
离线可用:本地运行,无需联网,隐私无忧硬件要求:消费级方案需要 RTX 3090/4070+
零成本(开源模型):自部署无需平台订阅费效果需调优:开箱效果不如 MJ,需搭配模型/LoRA
无限扩展:LoRA、ControlNet、自定义训练社区分散:模型、工具来自不同社区,需自行整合
批量生成:适合大规模自动化生产任务版权不确定性:训练数据来源存在争议

适用场景

  • 自部署需求:企业内部数据安全要求,不能使用云端服务
  • 自定义训练:需要用自己的数据集微调模型
  • 批量生成:电商产品图、游戏素材等大规模生产
  • 精细化控制:使用 ControlNet 精确控制构图、姿态、深度
  • 研究与开发:模型调优、架构实验、学术研究
  • 工作流集成:嵌入到现有的内容生产管线中

快速上手

text
方案一:云端免配置体验(推荐新手)
1. 访问 replicate.com 或 civitai.com 在线体验
2. 搜索 FLUX.2 或 SD 3.5 模型
3. 直接输入提示词生成,无需本地配置
4. 下载其他用户分享的 LoRA 模型体验定制效果

方案二:本地部署(推荐开发者)
1. 安装 ComfyUI(comfy.org)
2. 下载 FLUX.2 [klein] 4B 模型
3. 启动 ComfyUI,加载默认工作流
4. 在 ComfyUI 中构建或导入工作流
5. 使用 ControlNet、LoRA 等高级功能

方案三:企业 API(推荐商用)
1. 注册 Black Forest Labs API(FLUX.2 [pro])
2. 或使用 Stability AI API(Stable Image Ultra/Core)
3. 按使用量付费,无需管理基础设施

本地部署的需求评估

在投入时间搭建本地部署之前,请先评估你的真实需求:是否真的需要离线运行?是否确实需要 ControlNet 级别的控制?如果是初学者,建议先使用云端体验验证效果满意后,再决定是否投入本地部署。


5. 平台对比总览

核心维度对比

维度MidjourneyDALL-E 3Adobe FireflySD 3.5 / FLUX
图像质量⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
提示词遵循⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
文字渲染⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐(FLUX)
风格可控性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
定制化程度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
商业版权友好✅ 付费版⚠️ 视情况✅ 最友好⚠️ 取决于模型许可证
易用性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
免费方案✅ 每天 2 张✅ 有限次数✅ 自部署免费

商业维度对比

维度MidjourneyDALL-E 3Adobe FireflySD 3.5 / FLUX
月费$10-120$0 / $20$0 / $5-55$0(自部署)
年费优惠20% 折扣包含在 CC 年费不适用
API 可用❌ 无公开 API❌ 已停用✅ 支持✅ FLUX/SD API
隐身/隐私模式✅ Pro 以上✅ ChatGPT✅ 企业版✅ 本地运行
批量生产能力一般一般中等最佳
离线可用

场景推荐

如果你需要...推荐平台
最强的艺术美感和创意灵感Midjourney
快速将想法可视化,含文字DALL-E 3
商业用途,版权安全优先Adobe Firefly
完全控制,自定义工作流SD 3.5 / FLUX
在 Photoshop 中编辑Adobe Firefly
低成本的批量生成FLUX(自部署)
零花钱开始体验 AI 绘画DALL-E 3(免费版)
学习和研究 AI 绘画技术SD 3.5 / FLUX(开源版)

6. 新手入门指南

分步推荐路径

不同背景的用户可以按照不同的路径入门:

路径 A:零基础小白(最推荐)

text
第一步:DALL-E 3 免费版(Day 1,30 分钟)
- 注册 ChatGPT 免费账号
- 体验每天 2 张免费图像
- 重点感受:AI 绘画的能力边界

第二步:Midjourney Standard(Day 2-7,2 小时)
- 订阅 $30/月 Standard 套餐
- 学习基础提示词语法和参数
- 重点感受:AI 绘画的最好效果

第三步:Firefly 免费版(Day 7-14,1 小时)
- 注册 Adobe 账号
- 体验 Photoshop Generative Fill
- 重点感受:AI 与设计工具的集成

路径 B:设计师/创意从业者

text
第一步:Midjourney Standard(立即订阅)
- 投入时间学习参数系统(--ar, --s, --sref, --cref)
- 建立个人提示词库和风格库

第二步:Adobe Firefly(配合现有工作流)
- 如果你的工作流包含 Photoshop,安装 Firefly
- 使用 Generative Fill 加速设计迭代

第三步:按需学习 FLUX / SD(进阶)
- 当需要特定风格或更精细控制时
- 从 ComfyUI 云端体验开始

路径 C:开发者/技术用户

text
第一步:云端体验 FLUX / SD
- 访问 replicate.com 或 civitai.com
- 测试不同模型的效果差异

第二步:本地部署 ComfyUI + FLUX.2 [klein]
- 安装 ComfyUI
- 下载 FLUX.2 [klein] 4B 模型
- 构建第一个工作流

第三步:深入高级功能
- 尝试 ControlNet 精确控制构图
- 训练自己的 LoRA 模型
- 接入 API 实现自动化生成

免费体验总结

平台免费体验内容体验地址
DALL-E 3每天 2 张图像chat.openai.com
Adobe Firefly有限生成次数firefly.adobe.com
FLUX / SD云端免费体验(部分平台)replicate.com / civitai.com
通义万相注册送灵感值,每日签到tongyi.aliyun.com/wanxiang
即梦 AI每日 60-100 积分jimeng.jianying.com
可灵 AI免费积分制klingai.com

7. 本章小结

核心要点回顾

通过本节学习,你应该掌握了四大主流平台的核心特征:

Midjourney -- 艺术美感之王

  • V8 Alpha 带来 5 倍速度和原生 2K
  • 丰富的参数体系(--sref--cref 等)
  • 最适合创意设计、广告视觉、艺术创作

DALL-E 3 -- 提示词理解冠军

  • 与 ChatGPT 深度集成,文字渲染最佳
  • 免费可用(每天 2 张),API 已停用
  • 最适合快速原型、插画、含文字的内容

Adobe Firefly -- 商业版权最安全

  • 30+ 合作伙伴模型生态,Photoshop 深度集成
  • 授权训练数据 + 版权赔偿保护
  • 最适合企业设计、品牌物料、商业应用

SD 3.5 / FLUX -- 开源自由派

  • FLUX.2 [klein] 4B 亚秒级消费级推理
  • ControlNet、LoRA 实现的像素级控制
  • 最适合自部署、自定义、批量生成

选型决策树

text
你是哪种用户?
├── 零基础,想快速体验最佳效果
│   ├── 有预算 → Midjourney
│   └── 无预算 → DALL-E 3 免费版 / 通义万相
├── 设计师,需要与设计软件配合
│   ├── Adobe 用户 → Firefly + Photoshop
│   └── 独立创作 → Midjourney
├── 开发者,需要自动化/批量
│   ├── 需要完全控制 → FLUX / SD + ComfyUI
│   └── 需要 API → FLUX.2 [pro] API
└── 企业用户,版权安全优先
    ├── Adobe 生态用户 → Firefly 企业版
    └── 需要专用模型 → FLUX API + 定制训练

拓展阅读


下一步:在下一节中,我们将深入开源生态,了解 ComfyUI 工作流、ControlNet 空间控制和 LoRA 风格微调的核心技术。


← 返回章节目录 | 继续学习:开源生态与本地部署 →

最近更新

基于 MIT LICENSE 许可发布