通义千问与 Qwen 生态

学习目标: 了解 Qwen 模型家族、阿里云百炼平台和 ModelScope 社区
预计时间: 30 分钟
难度: ⭐⭐⭐☆☆

先说结论: Qwen 是国产开源模型的"瑞士军刀"。

不是"最强"，而是"最全"。Qwen 的家族从 0.5B 到 236B，覆盖文本、代码、视觉、语音、数学。你想部署多大就部署多大，想用什么能力就用什么能力。

而且 Qwen 背后是阿里，这意味着它与阿里云、钉钉、淘宝的集成是天然的优势。

Qwen 是谁？

通义千问是阿里巴巴旗下的 AI 大模型品牌。技术团队来自达摩院，最早 2023 年 4 月开放邀测。

Qwen 的核心策略很明确：开源覆盖、多模态演进、企业级集成。

这三个词翻译一下:

开源覆盖 — 各种尺寸的模型都开源，你在手机、笔记本、服务器上都能跑
多模态演进 — 不只是文本，还有视觉、代码、数学的专用模型
企业级集成 — 和阿里云、钉钉、DataWorks 深度整合

Qwen 模型家族

Qwen3 系列（2026.02 发布）

最新一代，全面转向 MoE（混合专家）架构:

模型	参数	架构	上下文	特点
Qwen3-235B-A22B	235B 总参/22B 激活	MoE	256K	旗舰，企业级
Qwen3-72B	72B	Dense	128K	高性能单机部署
Qwen3-32B	32B	Dense	128K	消费级 GPU 友好
Qwen3-14B	14B	Dense	128K	笔记本可跑
Qwen3-7B	7B	Dense	32K	移动端
Qwen3-0.5B	0.5B	Dense	32K	嵌入式设备

Qwen3 的关键升级:

原生 MoE 架构。237B 总参数但每次只激活 22B，推理速度和 22B 的 Dense 模型差不多，能力接近 237B。
119 种语言支持。不是"能说 119 种语言"，是在 119 种语言上做了专门的训练。
混合推理模式。可以在"思考模式"和"快速模式"之间切换，想深就深想浅就浅。

不是模型越大越好，是你 选对大小的模型，省的钱是实打实的。Qwen3-7B 在笔记本上跑推理任务，速度够快，成本为零（不需要 API 费用）。

专用模型

除了通用 Qwen3，阿里还发布了专门针对特定场景的模型:

Qwen-Coder（编程专用）:

版本	HumanEval	特点
Qwen3-Coder-32B	76.5%	对标 Code Llama
Qwen2.5-Coder-7B	70.2%	轻量编程辅助

Qwen-VL（视觉语言模型）:

版本	能力	场景
Qwen-VL-Max	图像理解+OCR+文档分析	文档解析、截图分析
Qwen-VL-Plus	中等视觉能力	图像描述、物体识别
Qwen-VL-Lite	轻量	集成到移动应用

Qwen-Audio（音频）:

语音识别、情感分析、声音事件检测
支持中文和英文

Qwen-Math（数学）:

专门优化数学推理
GSM8K 准确率 96%+

阿里云百炼平台

这是 Qwen 的"商业落地层"。百炼（Bailian）是阿里云的 AI 大模型服务平台。

能力

百炼提供的能力不只是 API:

百炼平台能力矩阵
├── 大模型推理 API
│   ├── Qwen3 系列（在线）
│   ├── Qwen-Coder
│   ├── Qwen-VL
│   └── 第三方模型（LLaMA、DeepSeek 等）
├── 模型微调服务
│   ├── 全参微调
│   ├── LoRA 微调
│   └── 数据标注工具
├── RAG 服务
│   ├── 向量数据库
│   ├── 文档解析
│   └── 知识库管理
├── Agent 框架
│   ├── 工作流编排
│   ├── 插件系统
│   └── 工具调用
└── 企业级特性
    ├── 数据隔离
    ├── 私有化部署
    └── 合规审计

定价

百炼的定价分按量和按 Token 两种模式：

模型	输入（¥/M tokens）	输出	缓存命中
Qwen3-Plus	¥2	¥8	¥0.5
Qwen3-Turbo	¥0.3	¥1	¥0.1
Qwen-Coder	¥3	¥12	¥0.8
Qwen-VL-Max	¥5	¥15	—

TIP

百炼新用户有 ¥200 免费额度（截至 2026.05）。够你跑各种测试一个月的。

API 调用

python

# 和 OpenAI 格式兼容
from openai import OpenAI

client = OpenAI(
    api_key="your-dashscope-api-key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

response = client.chat.completions.create(
    model="qwen3-plus",  # Qwen3 对话模型
    messages=[
        {"role": "system", "content": "你是精通代码的 AI 助手。"},
        {"role": "user", "content": "用 Go 写一个 HTTP 服务器"}
    ],
    temperature=0.7,
    max_tokens=2000
)

print(response.choices[0].message.content)

模型微调

百炼内置了微调工作台，不需要写代码:

上传数据集（JSONL 格式）
选择基座模型（Qwen3-Plus/Turbo 等）
选择微调方式（全参/LoRA）
启动训练
部署微调后的模型

成本估算:

LoRA 微调 Qwen3-7B: 约 ¥50/小时
全参微调 Qwen3-72B: 约 ¥500/小时

需要微调？先想想是真的需要微调，还是提示词没写好。90% 的场景，好的 Few-shot 提示词比微调省事省钱几个数量级。

ModelScope 社区

ModelScope（魔搭社区）是阿里开源模型的分发平台，你可以理解为「中国版 Hugging Face」。

定位

模型托管: 上传和下载模型权重
数据集: 中文数据集丰富
Notebook: 在线推理和微调
社区: 中文生态，文档和教程都是中文

相比 Hugging Face 的优势

维度	ModelScope	Hugging Face
下载速度	国内 CDN，快	需要镜像
中文模型	丰富，且有中文文档	英文为主
中文数据集	CV+NLP 都很多	相对少
在线环境	阿里云 GPU 免费额度	付费
社区活跃度	中文社区活跃	全球社区活跃

快速上手

bash

# 安装 modelscope
pip install modelscope

# 下载模型
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3-7B')

与阿里生态的集成

Qwen 最大的差异化优势是 和阿里系产品的深度集成:

钉钉: 智能助手、文档生成、会议纪要
淘宝/天猫: 智能客服、商品描述生成、搜索优化
阿里云: DataWorks 数据开发 AI 辅助
高德: 智能路线推荐、POI 描述
飞猪: 旅游攻略生成、智能客服

这也是为什么 Qwen 在中国企业级市场份额最大——不是因为能力碾压，是因为 它在你已经在用的产品里。

本节小结

✅ Qwen3 旗舰: MoE 架构，119 种语言，混合推理模式，¥2-8/M tokens ✅ 专用模型: Qwen-Coder（编程）、Qwen-VL（视觉）、Qwen-Audio（音频） ✅ 百炼平台提供 API+微调+RAG+Agent 一条龙服务，新用户 ¥200 免费额度 ✅ ModelScope 是中国版 Hugging Face，国内下载速度快 ✅ 与阿里云、钉钉、淘宝等产品深度集成，企业级部署无缝

← 返回章节目录 | 继续学习:豆包与字节 AI 矩阵 →

通义千问与 Qwen 生态 ​

Qwen 是谁？ ​

Qwen 模型家族 ​

Qwen3 系列（2026.02 发布） ​

专用模型 ​

阿里云百炼平台 ​

能力 ​

定价 ​

API 调用 ​

模型微调 ​

ModelScope 社区 ​

定位 ​

相比 Hugging Face 的优势 ​

快速上手 ​

与阿里生态的集成 ​

本节小结 ​