Skip to content

企业智能体能力与规范体系

角色:企业级智能体平台的能力基线页

适用范围:私有化、平台化、长期运行的企业智能体系统

说明:本文回答的是“企业平台必须具备什么能力、遵守什么约束、达到什么完整度”,而不是列举更多组件。

相关文档:

一、本文与组件页、协议页的区别

这三类页面职责不同:

  • 组件页回答“当前方案采用什么对象,它承担什么职责”。
  • 协议页和标准页回答“当前方案按什么接口、语义和规范互通”。
  • 本页回答“无论采用哪种实现,企业级平台最低必须具备什么能力”。

因此,本页不追求“组件列得全”,而追求三件事:

  1. 能力域是否完整。
  2. 强约束是否明确。
  3. 当前方案是否有对应落点。

二、判断一套平台是否达标的总标准

结合 NIST AI RMF 的治理思路,企业级智能体平台至少要同时满足以下要求:

  1. 有明确的治理责任,不把安全、评测、发布、审计留到后补。
  2. 能识别用户、组织、租户、数据域和动作权限。
  3. 能把知识、工具、模型和工作流放进同一条可追踪链路。
  4. 能把高风险动作纳入人工确认、双人复核或人工接管。
  5. 能把评测、灰度、回滚和容量验证纳入正式发布机制。
  6. 能在多个场景之间复用底座,而不是每个应用独立造一套。

三、能力域总览

能力域企业级最低要求强约束当前方案落点
治理与责任归属有平台 owner、数据 owner、应用 owner、发布责任链没有 owner 的能力不进入生产平台团队 + 业务团队 + 数据团队 + 安全团队协作
身份与组织上下文统一身份、组织属性、租户与渠道上下文认证与授权分离企业现有 SSO / IAM + APISIX + Casbin
门户与应用管理统一入口、应用目录、反馈闭环门户不承载底层智能逻辑AgentifUI + 门户 / BFF
运行时与编排多步任务、状态持久化、人工介入、失败恢复高风险动作不能走无审计直写主平台路线 + LangGraph + LangChain
工具与协议互操作工具有统一接入、参数契约和调用留痕协议优先于私有耦合MCPA2AOpenAPIJSON Schema
模型服务与治理统一模型入口、路由、配额、留痕和回滚上层不直接耦合底层推理实现LiteLLM + vLLM + Qwen
数据治理与知识供给数据先治理,再进入检索、查询和 AgentAI 不直接连原始源系统OpenMetadataSeaTunneldbt CoreApache TikaLlamaIndex
检索与答案质量权限感知检索、引用、增量更新、失效治理不允许默认把全量原文塞给模型LlamaIndex + Weaviate
授权与动作治理动作级授权、审批、人工接管、审计写操作和外发动作必须可裁决Casbin + 规范页体系
观测、评测与发布全链路追踪、离线评测、灰度、回滚、容量验证不允许直接在生产手工改关键行为配置LangFuse + OpenTelemetry + k6
运行与 SRE多环境、备份恢复、容量规划、故障处理生产环境必须可恢复K3sPostgreSQLRedisMinIO

四、详细能力要求

1. 治理与责任归属

企业级平台首先不是技术堆栈问题,而是责任链问题。

最低要求:

  • 有平台 owner
  • 有数据 owner
  • 有应用 owner
  • 有发布审批与回滚责任人

规范要求:

  • 平台级能力和业务应用能力分开管理
  • 任何影响行为的配置都应有责任人和变更记录
  • 没有责任归属的能力不进入正式生产

当前方案落点:

2. 身份、组织与访问上下文

企业智能体平台不是匿名聊天系统,必须带完整组织上下文运行。

最低要求:

  • 所有用户通过企业统一身份体系进入平台
  • 用户、部门、角色、租户、渠道和应用上下文可传递到运行链路
  • 认证、授权、审计是连续链路,不是彼此割裂

规范要求:

  • 优先对接企业现有 OIDC / OAuth2 / SAML / SCIM
  • 认证不等于授权
  • 身份属性不能只存在前端会话里

当前方案落点:

  • 企业现有 SSO / IAM
  • APISIX
  • Casbin

3. 门户与应用管理

企业平台需要统一入口,而不是多套零散聊天界面。

最低要求:

  • 应用目录、应用 owner、应用分组和反馈通道
  • 统一入口和统一会话入口
  • 区分公共应用、部门应用和高风险应用

规范要求:

  • 门户只负责入口和应用分发
  • 核心智能逻辑不写死在前端页面

当前方案落点:

  • AgentifUI
  • 门户 / BFF / API 层

4. 运行时与编排

企业级 Agent 不是“Prompt + 模型”的单步调用,而是有状态运行时。

最低要求:

  • 多步任务表达能力
  • 状态持久化
  • 超时、重试、失败恢复和回放
  • 人工确认和人工接管

规范要求:

  • 高风险动作必须进入审批 / 复核模式
  • 长链路任务必须可中断、可恢复
  • 编排逻辑、工具 Schema、上下文模板应版本化

当前方案落点:

  • 标准场景:DifyRAGFlowCoze Studio 三选一
  • 复杂状态流程:LangGraph
  • 工程编排与适配:LangChain
  • 长期记忆场景:Letta

5. 工具与协议互操作

企业平台必须解决“工具怎么接”和“Agent 怎么协作”。

最低要求:

  • 工具接入有统一协议和契约
  • 输入输出结构有标准描述
  • 跨系统协作链路可追踪

规范要求:

  • MCP 负责 agent-to-tool / context
  • A2A 负责 agent-to-agent
  • 工具参数、结果结构和校验规则应标准化
  • 工具调用日志进入统一 Trace

当前方案落点:

  • MCP
  • A2A
  • OpenAPI
  • JSON Schema

6. 模型服务与模型治理

模型必须被当成受控基础设施,而不是被各业务应用直接点对点接入。

最低要求:

  • 统一模型入口
  • 路由、配额、限流和故障切换
  • 模型版本记录和发布回滚能力
  • 输入输出留痕

规范要求:

  • 对上统一兼容接口
  • 不让上层应用直接绑定底层推理实现
  • 模型切换必须进入评测和灰度

当前方案落点:

  • LiteLLM
  • vLLM
  • Qwen 模型族

7. 数据治理与知识供给

企业 AI 平台不应让每个应用直接连接原始业务系统,而应先经过统一数据治理层。

最低要求:

  • 数据源登记
  • 采集、清洗、标准化
  • 元数据、标签、责任人和生命周期治理
  • 面向 AI 的数据服务发布

规范要求:

  • 数据至少区分原始层、治理中间层和可消费层
  • 权限标签要能贯穿到检索和查询链路
  • AI 应用优先消费治理后的数据服务

当前方案落点:

  • OpenMetadata
  • SeaTunnel
  • dbt Core
  • Apache Tika
  • MinIO
  • PostgreSQL

8. 检索与答案质量

企业 RAG 的重点不是“能搜到”,而是“能在权限和质量约束下稳定给出可追溯答案”。

最低要求:

  • 权限感知检索
  • 引用来源
  • 增量更新和失效处理
  • 重排和结果质量控制

规范要求:

  • 不允许把全量原文默认注入模型
  • 回答尽可能带引用和依据
  • 检索质量、失效数据和坏样本进入持续治理

当前方案落点:

  • LlamaIndex
  • Weaviate
  • 条件演进到 Milvus
  • 全文 / 混合检索兼容 Elasticsearch

9. 授权与动作治理

企业权限体系不能只停留在“有角色表”,而要覆盖完整动作链。

最低要求:

  • 应用访问授权
  • 知识检索授权
  • 工具调用授权
  • 数据域与租户隔离
  • 高风险动作审批

规范要求:

  • RBAC + ABAC 组合使用
  • 策略版本化、可审计、可回滚
  • 人工审批 / 人工接管是架构约束,不是建议项

当前方案落点:

10. 观测、评测与发布

企业平台要同时看“系统跑得稳不稳”和“模型答得对不对”。

最低要求:

  • 统一 Trace 语义
  • 指标、日志、追踪和 LLM 观测
  • 离线评测和线上抽样复盘
  • 灰度、回滚和容量验证

规范要求:

  • 平台级观测和 AI 级观测缺一不可
  • 发布前必须经过评测、权限检查和容量验证
  • 不允许在生产环境直接手工修改关键行为配置

当前方案落点:

  • OpenTelemetry
  • Prometheus
  • Grafana
  • Loki
  • LangFuse
  • k6

11. 运行与 SRE

只要平台进入真实业务流量,就必须具备长期运行能力。

最低要求:

  • dev / staging / prod 多环境
  • 备份、恢复与回滚
  • 有状态组件的容量规划
  • 关键链路故障处理预案

规范要求:

  • 生产环境必须可恢复
  • 持久化数据必须有备份和恢复演练
  • 模型层、检索层、治理层可分别扩缩容

当前方案落点:

  • K3s
  • PostgreSQL
  • Redis
  • MinIO

五、企业生产基线清单

进入正式生产前,至少要确认以下问题都已被回答:

  • 平台、数据、应用、发布各自的 owner 是谁
  • 身份、授权、审计链路是否完整
  • 模型、知识、工具、策略是否纳入版本和发布流程
  • 高风险动作是否有审批、人工确认和人工接管
  • 检索是否带权限过滤和来源引用
  • 发布前是否有评测、灰度和容量基线
  • 生产环境是否可回滚、可恢复、可复盘

六、与当前方案的关系

本页定义的是能力基线,不替代下列页面:

七、一句话收敛

企业级智能体平台的成熟度,不取决于用了多少组件,而取决于:是否把身份、数据、运行时、模型、动作、评测、发布和运维放进同一套受控体系。

参考资料

Open-source first, enterprise-ready.