企业智能体能力与规范体系
角色:企业级智能体平台的能力基线页
适用范围:私有化、平台化、长期运行的企业智能体系统
说明:本文回答的是“企业平台必须具备什么能力、遵守什么约束、达到什么完整度”,而不是列举更多组件。
相关文档:
一、本文与组件页、协议页的区别
这三类页面职责不同:
- 组件页回答“当前方案采用什么对象,它承担什么职责”。
- 协议页和标准页回答“当前方案按什么接口、语义和规范互通”。
- 本页回答“无论采用哪种实现,企业级平台最低必须具备什么能力”。
因此,本页不追求“组件列得全”,而追求三件事:
- 能力域是否完整。
- 强约束是否明确。
- 当前方案是否有对应落点。
二、判断一套平台是否达标的总标准
结合 NIST AI RMF 的治理思路,企业级智能体平台至少要同时满足以下要求:
- 有明确的治理责任,不把安全、评测、发布、审计留到后补。
- 能识别用户、组织、租户、数据域和动作权限。
- 能把知识、工具、模型和工作流放进同一条可追踪链路。
- 能把高风险动作纳入人工确认、双人复核或人工接管。
- 能把评测、灰度、回滚和容量验证纳入正式发布机制。
- 能在多个场景之间复用底座,而不是每个应用独立造一套。
三、能力域总览
| 能力域 | 企业级最低要求 | 强约束 | 当前方案落点 |
|---|---|---|---|
| 治理与责任归属 | 有平台 owner、数据 owner、应用 owner、发布责任链 | 没有 owner 的能力不进入生产 | 平台团队 + 业务团队 + 数据团队 + 安全团队协作 |
| 身份与组织上下文 | 统一身份、组织属性、租户与渠道上下文 | 认证与授权分离 | 企业现有 SSO / IAM + APISIX + Casbin |
| 门户与应用管理 | 统一入口、应用目录、反馈闭环 | 门户不承载底层智能逻辑 | AgentifUI + 门户 / BFF |
| 运行时与编排 | 多步任务、状态持久化、人工介入、失败恢复 | 高风险动作不能走无审计直写 | 主平台路线 + LangGraph + LangChain |
| 工具与协议互操作 | 工具有统一接入、参数契约和调用留痕 | 协议优先于私有耦合 | MCP、A2A、OpenAPI、JSON Schema |
| 模型服务与治理 | 统一模型入口、路由、配额、留痕和回滚 | 上层不直接耦合底层推理实现 | LiteLLM + vLLM + Qwen |
| 数据治理与知识供给 | 数据先治理,再进入检索、查询和 Agent | AI 不直接连原始源系统 | OpenMetadata、SeaTunnel、dbt Core、Apache Tika、LlamaIndex |
| 检索与答案质量 | 权限感知检索、引用、增量更新、失效治理 | 不允许默认把全量原文塞给模型 | LlamaIndex + Weaviate |
| 授权与动作治理 | 动作级授权、审批、人工接管、审计 | 写操作和外发动作必须可裁决 | Casbin + 规范页体系 |
| 观测、评测与发布 | 全链路追踪、离线评测、灰度、回滚、容量验证 | 不允许直接在生产手工改关键行为配置 | LangFuse + OpenTelemetry + k6 |
| 运行与 SRE | 多环境、备份恢复、容量规划、故障处理 | 生产环境必须可恢复 | K3s、PostgreSQL、Redis、MinIO |
四、详细能力要求
1. 治理与责任归属
企业级平台首先不是技术堆栈问题,而是责任链问题。
最低要求:
- 有平台 owner
- 有数据 owner
- 有应用 owner
- 有发布审批与回滚责任人
规范要求:
- 平台级能力和业务应用能力分开管理
- 任何影响行为的配置都应有责任人和变更记录
- 没有责任归属的能力不进入正式生产
当前方案落点:
2. 身份、组织与访问上下文
企业智能体平台不是匿名聊天系统,必须带完整组织上下文运行。
最低要求:
- 所有用户通过企业统一身份体系进入平台
- 用户、部门、角色、租户、渠道和应用上下文可传递到运行链路
- 认证、授权、审计是连续链路,不是彼此割裂
规范要求:
- 优先对接企业现有
OIDC / OAuth2 / SAML / SCIM - 认证不等于授权
- 身份属性不能只存在前端会话里
当前方案落点:
- 企业现有
SSO / IAM APISIXCasbin
3. 门户与应用管理
企业平台需要统一入口,而不是多套零散聊天界面。
最低要求:
- 应用目录、应用 owner、应用分组和反馈通道
- 统一入口和统一会话入口
- 区分公共应用、部门应用和高风险应用
规范要求:
- 门户只负责入口和应用分发
- 核心智能逻辑不写死在前端页面
当前方案落点:
AgentifUI- 门户 / BFF / API 层
4. 运行时与编排
企业级 Agent 不是“Prompt + 模型”的单步调用,而是有状态运行时。
最低要求:
- 多步任务表达能力
- 状态持久化
- 超时、重试、失败恢复和回放
- 人工确认和人工接管
规范要求:
- 高风险动作必须进入审批 / 复核模式
- 长链路任务必须可中断、可恢复
- 编排逻辑、工具 Schema、上下文模板应版本化
当前方案落点:
- 标准场景:
Dify、RAGFlow、Coze Studio三选一 - 复杂状态流程:
LangGraph - 工程编排与适配:
LangChain - 长期记忆场景:
Letta
5. 工具与协议互操作
企业平台必须解决“工具怎么接”和“Agent 怎么协作”。
最低要求:
- 工具接入有统一协议和契约
- 输入输出结构有标准描述
- 跨系统协作链路可追踪
规范要求:
MCP负责 agent-to-tool / contextA2A负责 agent-to-agent- 工具参数、结果结构和校验规则应标准化
- 工具调用日志进入统一 Trace
当前方案落点:
MCPA2AOpenAPIJSON Schema
6. 模型服务与模型治理
模型必须被当成受控基础设施,而不是被各业务应用直接点对点接入。
最低要求:
- 统一模型入口
- 路由、配额、限流和故障切换
- 模型版本记录和发布回滚能力
- 输入输出留痕
规范要求:
- 对上统一兼容接口
- 不让上层应用直接绑定底层推理实现
- 模型切换必须进入评测和灰度
当前方案落点:
LiteLLMvLLMQwen模型族
7. 数据治理与知识供给
企业 AI 平台不应让每个应用直接连接原始业务系统,而应先经过统一数据治理层。
最低要求:
- 数据源登记
- 采集、清洗、标准化
- 元数据、标签、责任人和生命周期治理
- 面向 AI 的数据服务发布
规范要求:
- 数据至少区分原始层、治理中间层和可消费层
- 权限标签要能贯穿到检索和查询链路
- AI 应用优先消费治理后的数据服务
当前方案落点:
OpenMetadataSeaTunneldbt CoreApache TikaMinIOPostgreSQL
8. 检索与答案质量
企业 RAG 的重点不是“能搜到”,而是“能在权限和质量约束下稳定给出可追溯答案”。
最低要求:
- 权限感知检索
- 引用来源
- 增量更新和失效处理
- 重排和结果质量控制
规范要求:
- 不允许把全量原文默认注入模型
- 回答尽可能带引用和依据
- 检索质量、失效数据和坏样本进入持续治理
当前方案落点:
LlamaIndexWeaviate- 条件演进到
Milvus - 全文 / 混合检索兼容
Elasticsearch
9. 授权与动作治理
企业权限体系不能只停留在“有角色表”,而要覆盖完整动作链。
最低要求:
- 应用访问授权
- 知识检索授权
- 工具调用授权
- 数据域与租户隔离
- 高风险动作审批
规范要求:
RBAC + ABAC组合使用- 策略版本化、可审计、可回滚
- 人工审批 / 人工接管是架构约束,不是建议项
当前方案落点:
10. 观测、评测与发布
企业平台要同时看“系统跑得稳不稳”和“模型答得对不对”。
最低要求:
- 统一 Trace 语义
- 指标、日志、追踪和 LLM 观测
- 离线评测和线上抽样复盘
- 灰度、回滚和容量验证
规范要求:
- 平台级观测和 AI 级观测缺一不可
- 发布前必须经过评测、权限检查和容量验证
- 不允许在生产环境直接手工修改关键行为配置
当前方案落点:
OpenTelemetryPrometheusGrafanaLokiLangFusek6
11. 运行与 SRE
只要平台进入真实业务流量,就必须具备长期运行能力。
最低要求:
dev / staging / prod多环境- 备份、恢复与回滚
- 有状态组件的容量规划
- 关键链路故障处理预案
规范要求:
- 生产环境必须可恢复
- 持久化数据必须有备份和恢复演练
- 模型层、检索层、治理层可分别扩缩容
当前方案落点:
K3sPostgreSQLRedisMinIO
五、企业生产基线清单
进入正式生产前,至少要确认以下问题都已被回答:
- 平台、数据、应用、发布各自的 owner 是谁
- 身份、授权、审计链路是否完整
- 模型、知识、工具、策略是否纳入版本和发布流程
- 高风险动作是否有审批、人工确认和人工接管
- 检索是否带权限过滤和来源引用
- 发布前是否有评测、灰度和容量基线
- 生产环境是否可回滚、可恢复、可复盘
六、与当前方案的关系
本页定义的是能力基线,不替代下列页面:
- 具体用什么组件,见 组件
- 当前组合怎么搭,见 技术选型
- 架构层次怎么分,见 总体架构
- 协议和标准怎么落位,见 协议与标准体系
- 数据链路怎么治理,见 数据治理层(企业 AI 数据底座)
七、一句话收敛
企业级智能体平台的成熟度,不取决于用了多少组件,而取决于:是否把身份、数据、运行时、模型、动作、评测、发布和运维放进同一套受控体系。
