扩展升级
角色:企业智能体系统建设中的扩展能力研究与升级方向页
说明:本文总结的是企业建设智能体系统时经常需要、但当前正式组件清单尚未纳入的能力与代表性开源组件。本文不是当前正式组件清单,不改变 组件 页的公开口径。
相关文档:
一、为什么需要这页
当前方案已经能覆盖企业智能体平台的主干能力,但在真实建设过程中,企业常常还会碰到一些额外能力诉求:
- 长时异步任务和跨系统流程需要更强的持久化编排
- 多系统事件驱动集成需要消息与流式底座
- 多系统统一策略需要更强的
Policy as Code能力 - 敏感数据识别、脱敏和合规审查需要专门能力
- 数据质量和多源查询在部分场景下需要额外补齐
- 浏览器自动化或 UI 级执行需要专门运行能力
- Agent 直接返回表单、卡片和审批界面时,需要声明式动态交互协议
这些能力并不一定都要进入当前正式方案,但在企业级建设中很常见,因此有必要单独说明。
二、使用边界
本文遵守三条边界:
- 这里只讨论“当前正式方案未纳入”的扩展能力与代表性开源组件。
- 本文不把这些对象自动升级为当前公开主清单。
- 只有在现有组件边界明显不足时,才建议单独评估是否引入。
三、扩展能力总览
| 扩展能力 | 当前方案已覆盖到哪里 | 仍可能不足的地方 | 代表性开源组件(未纳入当前正式清单) |
|---|---|---|---|
| 长时异步流程与持久化工作流 | LangGraph 已覆盖复杂状态机和人工介入 | 跨天 / 跨周任务、独立任务队列、分布式补偿和超长时恢复 | Temporal |
| 事件流与异步集成总线 | 当前以同步 API、工具调用和协议层为主 | 大规模事件驱动、松耦合集成、回放和异步解耦 | Apache Kafka、Redpanda |
集中式策略决策与多系统 Policy as Code | 当前以 Casbin 为主 | 跨平台统一策略评估、独立 PDP、基础设施层策略治理 | OPA |
| 密钥、动态凭据与工作负载身份 | 当前默认复用企业现有 KMS / 证书体系 | 企业缺少统一密钥和动态凭据平台时的落地能力 | Vault |
| 敏感信息识别与脱敏 | 当前以规则、权限和模型前后置控制为主 | 专门的 PII 识别、匿名化、图片脱敏和结构化脱敏 | Presidio |
| 数据质量验证与发布门槛 | 当前有 dbt Core、治理流程和元数据体系 | 面向表、文件、索引发布前的显式质量校验和验证报告 | Great Expectations |
| 联邦查询与受控多源分析 | 当前以治理后数据层、PostgreSQL 和检索为主 | 多源联邦 SQL、跨存储统一查询入口 | Trino |
| 浏览器自动化与 UI 级执行 | 当前主要通过工具调用和协议集成 | Web UI 自动化、浏览器步骤回放、页面级任务执行 | Playwright |
| Agent 驱动界面与动态交互协议 | 当前以固定门户页面、组件页面和前端静态组件为主 | 动态表单、审批卡片、工件面板、运行中断补录与跨 runtime 统一交互表达 | A2UI |
四、逐项说明
1. 长时异步流程与持久化工作流
这项能力解决什么问题
当流程跨越数小时、数天甚至更久时,仅靠应用内状态机通常会开始变得脆弱。企业会需要:
- 独立任务队列
- 长时任务恢复
- 分布式重试与补偿
- 工作流版本演进
当前方案为什么还没纳入
当前正式方案优先用 LangGraph 覆盖复杂 Agent 运行时和带人工介入的状态链路,先解决智能体平台主问题,而不是一开始就上独立工作流底座。
什么时候值得评估
- 高比例任务跨天执行
- 大量异步回调或批处理
- 需要独立的 workflow service 和 worker fleet
代表性组件
Temporal
官方参考
2. 事件流与异步集成总线
这项能力解决什么问题
当前方案已能通过 API、工具和协议层实现集成,但在下面这些情况里,事件总线会更合适:
- 多系统松耦合集成
- 实时事件分发
- 异步回放与削峰填谷
- 高吞吐数据流和消费组处理
当前方案为什么还没纳入
当前方案优先围绕业务可落地的主链收敛,很多场景在第一阶段并不需要完整消息流平台。
什么时候值得评估
- 多系统事件风暴明显
- 同步调用链过长
- 需要离线索引、异步补偿和大规模事件消费
代表性组件
Apache KafkaRedpanda
官方参考
3. 集中式策略决策与多系统 Policy as Code
这项能力解决什么问题
Casbin 非常适合当前方案里的应用级和动作级授权,但当企业想把策略统一扩展到更多系统层面时,常见诉求会变成:
- 独立的策略决策点
- 跨系统统一策略评估
- 基础设施与平台策略共用一套语言
当前方案为什么还没纳入
当前方案优先收敛授权链路,把复杂度控制在 Casbin + 规范页体系 这组能力里。
什么时候值得评估
- 多平台都想共用一套策略语言
- 需要独立 PDP
- 希望把应用、平台、基础设施治理统一到同一套
Policy as Code
代表性组件
OPA
官方参考
4. 密钥、动态凭据与工作负载身份
这项能力解决什么问题
当前方案默认复用企业现有 KMS / 证书体系。但如果企业现有能力不足,通常还需要补齐:
- API Key / Secret 集中管理
- 动态凭据发放
- 短期凭据和轮换
- 工作负载身份与审计
当前方案为什么还没纳入
因为这类能力在企业里通常已有统一安全平台,不适合默认作为智能体平台新增组件。
什么时候值得评估
- 企业没有成熟的密钥和动态凭据平台
- 智能体工具大量依赖外部 API 密钥
- 需要短期凭据和工作负载身份
代表性组件
Vault
官方参考
5. 敏感信息识别与脱敏
这项能力解决什么问题
当前方案已经强调权限过滤、Prompt 前置控制和输出审查,但企业在合规要求更强时,往往还需要更专门的能力:
- 文本 PII 识别
- 匿名化 / 脱敏
- 图片或扫描件中的敏感信息遮盖
- 结构化 / 半结构化数据脱敏
当前方案为什么还没纳入
因为很多企业已经有现成 DLP / 合规平台,或者会先用规则和流程兜底,而不是一开始就引入专门引擎。
什么时候值得评估
- 涉及客户、员工、合同、财务等敏感数据
- 对文本和图片都要求脱敏
- 想把脱敏能力做成独立服务
代表性组件
Presidio
官方参考
6. 数据质量验证与发布门槛
这项能力解决什么问题
当前方案已有 OpenMetadata、SeaTunnel、dbt Core、Apache Tika,但在某些企业里,仍会需要更显式的数据验证能力,例如:
- 表结构和字段完整性验证
- 索引发布前质量校验
- 验证报告和质量门槛
当前方案为什么还没纳入
当前方案优先以治理流程和 dbt Core 的建模约束为主,避免在第一阶段再引入独立数据质量平台。
什么时候值得评估
- 数据质量问题已经频繁影响回答质量
- 需要显式 Expectation / Validation 报告
- 想把“数据是否可发布给 AI”做成独立门槛
代表性组件
Great Expectations
官方参考
7. 联邦查询与受控多源分析
这项能力解决什么问题
当企业进入复杂分析场景时,仅靠单一治理后数据层和单库查询可能不够,还会出现:
- 多源联合分析
- 跨对象存储、数据库、数据湖查询
- 统一 SQL 访问层
当前方案为什么还没纳入
当前方案的数据分析场景先围绕治理后数据层、OpenMetadata、dbt Core、PostgreSQL 和受控应用链路展开,避免一开始引入更重的多源查询底座。
什么时候值得评估
- 多源联合分析需求明显增加
- 单一数据库或单一数据层难以承载分析范围
- 需要对外提供统一 SQL 查询入口
代表性组件
Trino
官方参考
8. 浏览器自动化与 UI 级执行
这项能力解决什么问题
当前方案支持工具调用,但如果企业有大量“只有 Web UI 没有稳定 API”的系统,往往还需要:
- 浏览器自动化
- UI 步骤回放
- 页面级任务执行
- 端到端交互脚本
当前方案为什么还没纳入
因为这类能力并不是所有企业智能体平台都需要;很多企业会优先接 API,而不是先做 UI 自动化。
什么时候值得评估
- 关键系统没有稳定 API
- 操作步骤主要发生在浏览器页面
- 需要把人工页面操作变成可复用 Agent 工具
代表性组件
Playwright
官方参考
9. Agent 驱动界面与动态交互协议
这项能力解决什么问题
当前方案已经有统一门户和固定页面,但如果后续希望让 agent 或 runtime 在运行时返回可安全渲染的 UI,企业通常还会需要:
- 动态表单与参数补录界面
- 审批卡片与人工确认面板
- 工件展示卡片和结果工作台
- 运行中断后的上下文补录与恢复
- 不同 runtime 之间更一致的前台交互表达
当前方案为什么还没纳入
当前正式方案优先解决统一门户、应用目录、权限、编排接入和治理链路,不把“agent 生成界面协议”作为第一阶段核心依赖。
此外,A2UI 当前仍处于公开预览早期阶段,更适合作为扩展升级方向或候选标准,而不是立即升级为当前正式组件。
什么时候值得评估
- 需要让 agent 返回表单、卡片或审批界面,而不是只返回文本
- 多个 runtime 都希望通过统一前端协议表达交互界面
- 需要把人工确认、人工补录和工件展示纳入标准事件流
- 希望在门户层建立“声明式动态 UI + 白名单组件渲染”能力
代表性组件
A2UI
官方参考
五、建议的评估顺序
如果企业后续要补齐这些扩展能力,建议按以下优先级评估:
- 密钥、动态凭据与工作负载身份
- 数据质量验证与发布门槛
- 集中式策略决策与多系统
Policy as Code - 长时异步流程与持久化工作流
- 事件流与异步集成总线
- 敏感信息识别与脱敏
- 联邦查询与受控多源分析
- 浏览器自动化与 UI 级执行
- Agent 驱动界面与动态交互协议
前四项更偏平台控制力和生产可控性,后五项更偏场景扩展与规模化深化。
六、与当前正式方案的关系
本文与当前正式方案的关系应理解为:
- 组件 记录的是当前正式清单。
- 本文记录的是企业建设中常见、但当前尚未纳入正式清单的补齐方向。
- 只有在现有能力边界明显不足时,才建议从本文中挑选对象做专项评估。
七、一句话收敛
企业智能体平台的扩展重点,不是继续堆更多“看起来先进”的组件,而是在现有组件边界不足时,按能力缺口精准补齐工作流、事件流、策略、密钥、脱敏、数据质量、联邦查询、UI 执行和动态交互协议能力。
