Qwen 模型族
类型:模型组合
复用规则:稳定复用的组件说明页
所属层:模型网关与推理层
官方网站:https://qwen.readthedocs.io/
开源仓库地址:https://github.com/QwenLM
当前定位
Qwen 模型族承担当前方案的主模型能力池,用于覆盖通用生成、代码任务、向量化、重排和安全审查等不同模型职责。
主要职责
- 承担通用生成模型能力
- 承担代码与脚本任务能力
- 提供 Embedding 与 Reranker 能力
- 提供输入输出安全审查能力
与其他组件关系
适合场景
- 企业通用对话和问答场景
- 代码生成、脚本辅助和工程任务
- 知识检索中的 Embedding 与重排
- 输入输出安全审查链路
边界
- 模型族描述的是能力池,不是门户、编排或知识系统本身
- 不直接决定应用工作流架构
- 不应让上游应用硬编码依赖某个临时模型 ID
采用规则
- 当前方案按“通用生成模型 + 代码模型 + Embedding 模型 + Reranker 模型 + 安全模型”的组合方式使用
Qwen模型族。 - 公开文档只说明能力分工,不把易变的内部试验型号写成长期公开基线。
- 实施时应锁定具体模型 ID、部署规格和回退策略,并通过 LiteLLM 屏蔽上游差异。
治理注意点
- 不同用途模型应分池管理,避免把通用生成、向量化和安全审查混成单一黑盒入口。
- 模型升级、替换和回退前需要完成质量评测和兼容性验证。
- Embedding、Reranker 和安全模型要与知识链路、治理链路保持一致的调用与审计口径。
- 具体模型卡和许可证口径应在实施时再次核对,并与 开源状态与许可证说明 保持一致。
