通义千问与 Qwen 生态
学习目标: 了解 Qwen 模型家族、阿里云百炼平台和 ModelScope 社区
预计时间: 30 分钟
难度: ⭐⭐⭐☆☆
先说结论: Qwen 是国产开源模型的"瑞士军刀"。
不是"最强",而是"最全"。Qwen 的家族从 0.5B 到 236B,覆盖文本、代码、视觉、语音、数学。你想部署多大就部署多大,想用什么能力就用什么能力。
而且 Qwen 背后是阿里,这意味着它与阿里云、钉钉、淘宝的集成是天然的优势。
Qwen 是谁?
通义千问是阿里巴巴旗下的 AI 大模型品牌。技术团队来自达摩院,最早 2023 年 4 月开放邀测。
Qwen 的核心策略很明确:开源覆盖、多模态演进、企业级集成。
这三个词翻译一下:
- 开源覆盖 — 各种尺寸的模型都开源,你在手机、笔记本、服务器上都能跑
- 多模态演进 — 不只是文本,还有视觉、代码、数学的专用模型
- 企业级集成 — 和阿里云、钉钉、DataWorks 深度整合
Qwen 模型家族
Qwen3 系列(2026.02 发布)
最新一代,全面转向 MoE(混合专家)架构:
| 模型 | 参数 | 架构 | 上下文 | 特点 |
|---|---|---|---|---|
| Qwen3-235B-A22B | 235B 总参/22B 激活 | MoE | 256K | 旗舰,企业级 |
| Qwen3-72B | 72B | Dense | 128K | 高性能单机部署 |
| Qwen3-32B | 32B | Dense | 128K | 消费级 GPU 友好 |
| Qwen3-14B | 14B | Dense | 128K | 笔记本可跑 |
| Qwen3-7B | 7B | Dense | 32K | 移动端 |
| Qwen3-0.5B | 0.5B | Dense | 32K | 嵌入式设备 |
Qwen3 的关键升级:
- 原生 MoE 架构。237B 总参数但每次只激活 22B,推理速度和 22B 的 Dense 模型差不多,能力接近 237B。
- 119 种语言支持。不是"能说 119 种语言",是在 119 种语言上做了专门的训练。
- 混合推理模式。可以在"思考模式"和"快速模式"之间切换,想深就深想浅就浅。
不是模型越大越好,是你 选对大小的模型,省的钱是实打实的。Qwen3-7B 在笔记本上跑推理任务,速度够快,成本为零(不需要 API 费用)。
专用模型
除了通用 Qwen3,阿里还发布了专门针对特定场景的模型:
Qwen-Coder(编程专用):
| 版本 | HumanEval | 特点 |
|---|---|---|
| Qwen3-Coder-32B | 76.5% | 对标 Code Llama |
| Qwen2.5-Coder-7B | 70.2% | 轻量编程辅助 |
Qwen-VL(视觉语言模型):
| 版本 | 能力 | 场景 |
|---|---|---|
| Qwen-VL-Max | 图像理解+OCR+文档分析 | 文档解析、截图分析 |
| Qwen-VL-Plus | 中等视觉能力 | 图像描述、物体识别 |
| Qwen-VL-Lite | 轻量 | 集成到移动应用 |
Qwen-Audio(音频):
- 语音识别、情感分析、声音事件检测
- 支持中文和英文
Qwen-Math(数学):
- 专门优化数学推理
- GSM8K 准确率 96%+
阿里云百炼平台
这是 Qwen 的"商业落地层"。百炼(Bailian)是阿里云的 AI 大模型服务平台。
能力
百炼提供的能力不只是 API:
百炼平台能力矩阵
├── 大模型推理 API
│ ├── Qwen3 系列(在线)
│ ├── Qwen-Coder
│ ├── Qwen-VL
│ └── 第三方模型(LLaMA、DeepSeek 等)
├── 模型微调服务
│ ├── 全参微调
│ ├── LoRA 微调
│ └── 数据标注工具
├── RAG 服务
│ ├── 向量数据库
│ ├── 文档解析
│ └── 知识库管理
├── Agent 框架
│ ├── 工作流编排
│ ├── 插件系统
│ └── 工具调用
└── 企业级特性
├── 数据隔离
├── 私有化部署
└── 合规审计定价
百炼的定价分按量和按 Token 两种模式:
| 模型 | 输入(¥/M tokens) | 输出 | 缓存命中 |
|---|---|---|---|
| Qwen3-Plus | ¥2 | ¥8 | ¥0.5 |
| Qwen3-Turbo | ¥0.3 | ¥1 | ¥0.1 |
| Qwen-Coder | ¥3 | ¥12 | ¥0.8 |
| Qwen-VL-Max | ¥5 | ¥15 | — |
TIP
百炼新用户有 ¥200 免费额度(截至 2026.05)。够你跑各种测试一个月的。
API 调用
# 和 OpenAI 格式兼容
from openai import OpenAI
client = OpenAI(
api_key="your-dashscope-api-key",
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
response = client.chat.completions.create(
model="qwen3-plus", # Qwen3 对话模型
messages=[
{"role": "system", "content": "你是精通代码的 AI 助手。"},
{"role": "user", "content": "用 Go 写一个 HTTP 服务器"}
],
temperature=0.7,
max_tokens=2000
)
print(response.choices[0].message.content)模型微调
百炼内置了微调工作台,不需要写代码:
- 上传数据集(JSONL 格式)
- 选择基座模型(Qwen3-Plus/Turbo 等)
- 选择微调方式(全参/LoRA)
- 启动训练
- 部署微调后的模型
成本估算:
- LoRA 微调 Qwen3-7B: 约 ¥50/小时
- 全参微调 Qwen3-72B: 约 ¥500/小时
需要微调?先想想是真的需要微调,还是提示词没写好。90% 的场景,好的 Few-shot 提示词比微调省事省钱几个数量级。
ModelScope 社区
ModelScope(魔搭社区)是阿里开源模型的分发平台,你可以理解为「中国版 Hugging Face」。
定位
- 模型托管: 上传和下载模型权重
- 数据集: 中文数据集丰富
- Notebook: 在线推理和微调
- 社区: 中文生态,文档和教程都是中文
相比 Hugging Face 的优势
| 维度 | ModelScope | Hugging Face |
|---|---|---|
| 下载速度 | 国内 CDN,快 | 需要镜像 |
| 中文模型 | 丰富,且有中文文档 | 英文为主 |
| 中文数据集 | CV+NLP 都很多 | 相对少 |
| 在线环境 | 阿里云 GPU 免费额度 | 付费 |
| 社区活跃度 | 中文社区活跃 | 全球社区活跃 |
快速上手
# 安装 modelscope
pip install modelscope
# 下载模型
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3-7B')与阿里生态的集成
Qwen 最大的差异化优势是 和阿里系产品的深度集成:
- 钉钉: 智能助手、文档生成、会议纪要
- 淘宝/天猫: 智能客服、商品描述生成、搜索优化
- 阿里云: DataWorks 数据开发 AI 辅助
- 高德: 智能路线推荐、POI 描述
- 飞猪: 旅游攻略生成、智能客服
这也是为什么 Qwen 在中国企业级市场份额最大——不是因为能力碾压,是因为 它在你已经在用的产品里。
本节小结
✅ Qwen3 旗舰: MoE 架构,119 种语言,混合推理模式,¥2-8/M tokens ✅ 专用模型: Qwen-Coder(编程)、Qwen-VL(视觉)、Qwen-Audio(音频) ✅ 百炼平台提供 API+微调+RAG+Agent 一条龙服务,新用户 ¥200 免费额度 ✅ ModelScope 是中国版 Hugging Face,国内下载速度快 ✅ 与阿里云、钉钉、淘宝等产品深度集成,企业级部署无缝
