Skip to content

通义千问与 Qwen 生态

学习目标: 了解 Qwen 模型家族、阿里云百炼平台和 ModelScope 社区

预计时间: 30 分钟

难度: ⭐⭐⭐☆☆


先说结论: Qwen 是国产开源模型的"瑞士军刀"。

不是"最强",而是"最全"。Qwen 的家族从 0.5B 到 236B,覆盖文本、代码、视觉、语音、数学。你想部署多大就部署多大,想用什么能力就用什么能力。

而且 Qwen 背后是阿里,这意味着它与阿里云、钉钉、淘宝的集成是天然的优势。

Qwen 是谁?

通义千问是阿里巴巴旗下的 AI 大模型品牌。技术团队来自达摩院,最早 2023 年 4 月开放邀测。

Qwen 的核心策略很明确:开源覆盖、多模态演进、企业级集成

这三个词翻译一下:

  • 开源覆盖 — 各种尺寸的模型都开源,你在手机、笔记本、服务器上都能跑
  • 多模态演进 — 不只是文本,还有视觉、代码、数学的专用模型
  • 企业级集成 — 和阿里云、钉钉、DataWorks 深度整合

Qwen 模型家族

Qwen3 系列(2026.02 发布)

最新一代,全面转向 MoE(混合专家)架构:

模型参数架构上下文特点
Qwen3-235B-A22B235B 总参/22B 激活MoE256K旗舰,企业级
Qwen3-72B72BDense128K高性能单机部署
Qwen3-32B32BDense128K消费级 GPU 友好
Qwen3-14B14BDense128K笔记本可跑
Qwen3-7B7BDense32K移动端
Qwen3-0.5B0.5BDense32K嵌入式设备

Qwen3 的关键升级:

  1. 原生 MoE 架构。237B 总参数但每次只激活 22B,推理速度和 22B 的 Dense 模型差不多,能力接近 237B。
  2. 119 种语言支持。不是"能说 119 种语言",是在 119 种语言上做了专门的训练。
  3. 混合推理模式。可以在"思考模式"和"快速模式"之间切换,想深就深想浅就浅。

不是模型越大越好,是你 选对大小的模型,省的钱是实打实的。Qwen3-7B 在笔记本上跑推理任务,速度够快,成本为零(不需要 API 费用)。

专用模型

除了通用 Qwen3,阿里还发布了专门针对特定场景的模型:

Qwen-Coder(编程专用):

版本HumanEval特点
Qwen3-Coder-32B76.5%对标 Code Llama
Qwen2.5-Coder-7B70.2%轻量编程辅助

Qwen-VL(视觉语言模型):

版本能力场景
Qwen-VL-Max图像理解+OCR+文档分析文档解析、截图分析
Qwen-VL-Plus中等视觉能力图像描述、物体识别
Qwen-VL-Lite轻量集成到移动应用

Qwen-Audio(音频):

  • 语音识别、情感分析、声音事件检测
  • 支持中文和英文

Qwen-Math(数学):

  • 专门优化数学推理
  • GSM8K 准确率 96%+

阿里云百炼平台

这是 Qwen 的"商业落地层"。百炼(Bailian)是阿里云的 AI 大模型服务平台。

能力

百炼提供的能力不只是 API:

百炼平台能力矩阵
├── 大模型推理 API
│   ├── Qwen3 系列(在线)
│   ├── Qwen-Coder
│   ├── Qwen-VL
│   └── 第三方模型(LLaMA、DeepSeek 等)
├── 模型微调服务
│   ├── 全参微调
│   ├── LoRA 微调
│   └── 数据标注工具
├── RAG 服务
│   ├── 向量数据库
│   ├── 文档解析
│   └── 知识库管理
├── Agent 框架
│   ├── 工作流编排
│   ├── 插件系统
│   └── 工具调用
└── 企业级特性
    ├── 数据隔离
    ├── 私有化部署
    └── 合规审计

定价

百炼的定价分按量和按 Token 两种模式:

模型输入(¥/M tokens)输出缓存命中
Qwen3-Plus¥2¥8¥0.5
Qwen3-Turbo¥0.3¥1¥0.1
Qwen-Coder¥3¥12¥0.8
Qwen-VL-Max¥5¥15

TIP

百炼新用户有 ¥200 免费额度(截至 2026.05)。够你跑各种测试一个月的。

API 调用

python
# 和 OpenAI 格式兼容
from openai import OpenAI

client = OpenAI(
    api_key="your-dashscope-api-key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

response = client.chat.completions.create(
    model="qwen3-plus",  # Qwen3 对话模型
    messages=[
        {"role": "system", "content": "你是精通代码的 AI 助手。"},
        {"role": "user", "content": "用 Go 写一个 HTTP 服务器"}
    ],
    temperature=0.7,
    max_tokens=2000
)

print(response.choices[0].message.content)

模型微调

百炼内置了微调工作台,不需要写代码:

  1. 上传数据集(JSONL 格式)
  2. 选择基座模型(Qwen3-Plus/Turbo 等)
  3. 选择微调方式(全参/LoRA)
  4. 启动训练
  5. 部署微调后的模型

成本估算:

  • LoRA 微调 Qwen3-7B: 约 ¥50/小时
  • 全参微调 Qwen3-72B: 约 ¥500/小时

需要微调?先想想是真的需要微调,还是提示词没写好。90% 的场景,好的 Few-shot 提示词比微调省事省钱几个数量级。

ModelScope 社区

ModelScope(魔搭社区)是阿里开源模型的分发平台,你可以理解为「中国版 Hugging Face」。

定位

  • 模型托管: 上传和下载模型权重
  • 数据集: 中文数据集丰富
  • Notebook: 在线推理和微调
  • 社区: 中文生态,文档和教程都是中文

相比 Hugging Face 的优势

维度ModelScopeHugging Face
下载速度国内 CDN,快需要镜像
中文模型丰富,且有中文文档英文为主
中文数据集CV+NLP 都很多相对少
在线环境阿里云 GPU 免费额度付费
社区活跃度中文社区活跃全球社区活跃

快速上手

bash
# 安装 modelscope
pip install modelscope

# 下载模型
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3-7B')

与阿里生态的集成

Qwen 最大的差异化优势是 和阿里系产品的深度集成:

  • 钉钉: 智能助手、文档生成、会议纪要
  • 淘宝/天猫: 智能客服、商品描述生成、搜索优化
  • 阿里云: DataWorks 数据开发 AI 辅助
  • 高德: 智能路线推荐、POI 描述
  • 飞猪: 旅游攻略生成、智能客服

这也是为什么 Qwen 在中国企业级市场份额最大——不是因为能力碾压,是因为 它在你已经在用的产品里


本节小结

✅ Qwen3 旗舰: MoE 架构,119 种语言,混合推理模式,¥2-8/M tokens ✅ 专用模型: Qwen-Coder(编程)、Qwen-VL(视觉)、Qwen-Audio(音频) ✅ 百炼平台提供 API+微调+RAG+Agent 一条龙服务,新用户 ¥200 免费额度 ✅ ModelScope 是中国版 Hugging Face,国内下载速度快 ✅ 与阿里云、钉钉、淘宝等产品深度集成,企业级部署无缝


← 返回章节目录 | 继续学习:豆包与字节 AI 矩阵 →

最近更新

基于 MIT LICENSE 许可发布