企业智能体能力与规范体系

角色：企业级智能体平台的能力基线页
适用范围：私有化、平台化、长期运行的企业智能体系统
说明：本文回答的是“企业平台必须具备什么能力、遵守什么约束、达到什么完整度”，而不是列举更多组件。

一、本文与组件页、协议页的区别

这三类页面职责不同：

组件页回答“当前方案采用什么对象，它承担什么职责”。
协议页和标准页回答“当前方案按什么接口、语义和规范互通”。
本页回答“无论采用哪种实现，企业级平台最低必须具备什么能力”。

因此，本页不追求“组件列得全”，而追求三件事：

能力域是否完整。
强约束是否明确。
当前方案是否有对应落点。

二、判断一套平台是否达标的总标准

结合 NIST AI RMF 的治理思路，企业级智能体平台至少要同时满足以下要求：

有明确的治理责任，不把安全、评测、发布、审计留到后补。
能识别用户、组织、租户、数据域和动作权限。
能把知识、工具、模型和工作流放进同一条可追踪链路。
能把高风险动作纳入人工确认、双人复核或人工接管。
能把评测、灰度、回滚和容量验证纳入正式发布机制。
能在多个场景之间复用底座，而不是每个应用独立造一套。

三、能力域总览

能力域	企业级最低要求	强约束	当前方案落点
治理与责任归属	有平台 owner、数据 owner、应用 owner、发布责任链	没有 owner 的能力不进入生产	平台团队 + 业务团队 + 数据团队 + 安全团队协作
身份与组织上下文	统一身份、组织属性、租户与渠道上下文	认证与授权分离	企业现有 `SSO / IAM` + `APISIX` + `Casbin`
门户与应用管理	统一入口、应用目录、反馈闭环	门户不承载底层智能逻辑	`AgentifUI` + `OpenClaw`（条件组件）+ 门户 / BFF
运行时与编排	多步任务、状态持久化、人工介入、失败恢复	高风险动作不能走无审计直写	主平台路线 + `LangGraph` + `LangChain`
工具与协议互操作	工具有统一接入、参数契约和调用留痕	协议优先于私有耦合	`MCP`、`A2A`、`OpenAPI`、`JSON Schema`
模型服务与治理	统一模型入口、路由、配额、留痕和回滚	上层不直接耦合底层推理实现	`LiteLLM` + `vLLM` + `Qwen`
数据治理与知识供给	数据先治理，再进入检索、查询和 Agent	AI 不直接连原始源系统	`OpenMetadata`、`SeaTunnel`、`dbt Core`、`Apache Tika`、`LlamaIndex`
检索与答案质量	权限感知检索、引用、增量更新、失效治理	不允许默认把全量原文塞给模型	`LlamaIndex` + `Weaviate`
授权与动作治理	动作级授权、审批、人工接管、审计	写操作和外发动作必须可裁决	`Casbin` + 规范页体系
观测、评测与发布	全链路追踪、离线评测、灰度、回滚、容量验证	不允许直接在生产手工改关键行为配置	`LangFuse` + `OpenTelemetry` + `k6`
运行与 SRE	多环境、备份恢复、容量规划、故障处理	生产环境必须可恢复	`K3s`、`PostgreSQL`、`Redis`、`MinIO`

四、详细能力要求

1. 治理与责任归属

企业级平台首先不是技术堆栈问题，而是责任链问题。

最低要求：

有平台 owner
有数据 owner
有应用 owner
有发布审批与回滚责任人

规范要求：

平台级能力和业务应用能力分开管理
任何影响行为的配置都应有责任人和变更记录
没有责任归属的能力不进入正式生产

当前方案落点：

2. 身份、组织与访问上下文

企业智能体平台不是匿名聊天系统，必须带完整组织上下文运行。

最低要求：

所有用户通过企业统一身份体系进入平台
用户、部门、角色、租户、渠道和应用上下文可传递到运行链路
认证、授权、审计是连续链路，不是彼此割裂

规范要求：

优先对接企业现有 OIDC / OAuth2 / SAML / SCIM
认证不等于授权
身份属性不能只存在前端会话里

当前方案落点：

企业现有 SSO / IAM
APISIX
Casbin

3. 门户与应用管理

企业平台需要统一入口，而不是多套零散聊天界面。

这一能力域在当前方案中允许两种前台形态：

默认统一门户前台，重点是应用目录、工作台和多应用分发。
条件引入的成品化超级智能体前台，重点是单一高价值助手的连续交互和产品化体验。

两者都属于门户与应用管理域，不改变下游编排、知识、模型和治理的分层边界。

最低要求：

应用目录、应用 owner、应用分组和反馈通道
统一入口和统一会话入口
区分公共应用、部门应用和高风险应用

规范要求：

门户只负责入口和应用分发
核心智能逻辑不写死在前端页面
即使采用成品化超级智能体前台，也不能把模型路由、知识治理和权限策略下沉到前台内部

当前方案落点：

AgentifUI
OpenClaw（条件组件）
门户 / BFF / API 层

4. 运行时与编排

企业级 Agent 不是“Prompt + 模型”的单步调用，而是有状态运行时。

最低要求：

多步任务表达能力
状态持久化
超时、重试、失败恢复和回放
人工确认和人工接管

规范要求：

高风险动作必须进入审批 / 复核模式
长链路任务必须可中断、可恢复
编排逻辑、工具 Schema、上下文模板应版本化

当前方案落点：

标准场景：Dify、RAGFlow、Coze Studio 三选一
复杂状态流程：LangGraph
工程编排与适配：LangChain
长期记忆场景：Letta

5. 工具与协议互操作

企业平台必须解决“工具怎么接”和“Agent 怎么协作”。

最低要求：

工具接入有统一协议和契约
输入输出结构有标准描述
跨系统协作链路可追踪

规范要求：

MCP 负责 agent-to-tool / context
A2A 负责 agent-to-agent
工具参数、结果结构和校验规则应标准化
工具调用日志进入统一 Trace

当前方案落点：

MCP
A2A
OpenAPI
JSON Schema

6. 模型服务与模型治理

模型必须被当成受控基础设施，而不是被各业务应用直接点对点接入。

最低要求：

统一模型入口
路由、配额、限流和故障切换
模型版本记录和发布回滚能力
输入输出留痕

规范要求：

对上统一兼容接口
不让上层应用直接绑定底层推理实现
模型切换必须进入评测和灰度

当前方案落点：

LiteLLM
vLLM
Qwen 模型族

7. 数据治理与知识供给

企业 AI 平台不应让每个应用直接连接原始业务系统，而应先经过统一数据治理层。

最低要求：

数据源登记
采集、清洗、标准化
元数据、标签、责任人和生命周期治理
面向 AI 的数据服务发布

规范要求：

数据至少区分原始层、治理中间层和可消费层
权限标签要能贯穿到检索和查询链路
AI 应用优先消费治理后的数据服务

当前方案落点：

OpenMetadata
SeaTunnel
dbt Core
Apache Tika
MinIO
PostgreSQL

8. 检索与答案质量

企业 RAG 的重点不是“能搜到”，而是“能在权限和质量约束下稳定给出可追溯答案”。

最低要求：

权限感知检索
引用来源
增量更新和失效处理
重排和结果质量控制

规范要求：

不允许把全量原文默认注入模型
回答尽可能带引用和依据
检索质量、失效数据和坏样本进入持续治理

当前方案落点：

LlamaIndex
Weaviate
条件演进到 Milvus
全文 / 混合检索兼容 Elasticsearch

9. 授权与动作治理

企业权限体系不能只停留在“有角色表”，而要覆盖完整动作链。

最低要求：

应用访问授权
知识检索授权
工具调用授权
数据域与租户隔离
高风险动作审批

规范要求：

RBAC + ABAC 组合使用
策略版本化、可审计、可回滚
人工审批 / 人工接管是架构约束，不是建议项

当前方案落点：

10. 观测、评测与发布

企业平台要同时看“系统跑得稳不稳”和“模型答得对不对”。

最低要求：

统一 Trace 语义
指标、日志、追踪和 LLM 观测
离线评测和线上抽样复盘
灰度、回滚和容量验证

规范要求：

平台级观测和 AI 级观测缺一不可
发布前必须经过评测、权限检查和容量验证
不允许在生产环境直接手工修改关键行为配置

当前方案落点：

OpenTelemetry
Prometheus
Grafana
Loki
LangFuse
k6

11. 运行与 SRE

只要平台进入真实业务流量，就必须具备长期运行能力。

最低要求：

dev / staging / prod 多环境
备份、恢复与回滚
有状态组件的容量规划
关键链路故障处理预案

规范要求：

生产环境必须可恢复
持久化数据必须有备份和恢复演练
模型层、检索层、治理层可分别扩缩容

当前方案落点：

K3s
PostgreSQL
Redis
MinIO

五、企业生产基线清单

进入正式生产前，至少要确认以下问题都已被回答：

平台、数据、应用、发布各自的 owner 是谁
身份、授权、审计链路是否完整
模型、知识、工具、策略是否纳入版本和发布流程
高风险动作是否有审批、人工确认和人工接管
检索是否带权限过滤和来源引用
发布前是否有评测、灰度和容量基线
生产环境是否可回滚、可恢复、可复盘

六、与当前方案的关系

本页定义的是能力基线，不替代下列页面：

具体用什么组件，见组件
当前组合怎么搭，见技术选型
架构层次怎么分，见总体架构
协议和标准怎么落位，见协议与标准体系
数据链路怎么治理，见数据治理层（企业 AI 数据底座）

七、一句话收敛

企业级智能体平台的成熟度，不取决于用了多少组件，而取决于：是否把身份、数据、运行时、模型、动作、评测、发布和运维放进同一套受控体系。

1. 用户与渠道层

2. 统一接入与流量治理层

3. 门户与应用层

4. Agent 编排层

5. 数据治理层

6. 知识与检索层

7. 模型网关与推理层

8. 治理与观测层

9. 基础设施层

企业智能体能力与规范体系

一、本文与组件页、协议页的区别

二、判断一套平台是否达标的总标准

三、能力域总览

四、详细能力要求

1. 治理与责任归属

2. 身份、组织与访问上下文

3. 门户与应用管理

4. 运行时与编排

5. 工具与协议互操作

6. 模型服务与模型治理

7. 数据治理与知识供给

8. 检索与答案质量

9. 授权与动作治理

10. 观测、评测与发布

11. 运行与 SRE

五、企业生产基线清单

六、与当前方案的关系

七、一句话收敛

参考资料

企业智能体能力与规范体系 ​

一、本文与组件页、协议页的区别 ​

二、判断一套平台是否达标的总标准 ​

三、能力域总览 ​

四、详细能力要求 ​

1. 治理与责任归属 ​

2. 身份、组织与访问上下文 ​

3. 门户与应用管理 ​

4. 运行时与编排 ​

5. 工具与协议互操作 ​

6. 模型服务与模型治理 ​

7. 数据治理与知识供给 ​

8. 检索与答案质量 ​

9. 授权与动作治理 ​

10. 观测、评测与发布 ​

11. 运行与 SRE ​

五、企业生产基线清单 ​

六、与当前方案的关系 ​

七、一句话收敛 ​

参考资料 ​

企业智能体能力与规范体系

一、本文与组件页、协议页的区别

二、判断一套平台是否达标的总标准

三、能力域总览

四、详细能力要求

1. 治理与责任归属

2. 身份、组织与访问上下文

3. 门户与应用管理

4. 运行时与编排

5. 工具与协议互操作

6. 模型服务与模型治理

7. 数据治理与知识供给

8. 检索与答案质量

9. 授权与动作治理

10. 观测、评测与发布

11. 运行与 SRE

五、企业生产基线清单

六、与当前方案的关系

七、一句话收敛

参考资料