Milvus

类型：大规模向量检索演进底座
复用规则：条件引入的组件说明页
所属层：知识与检索层
官方网站：https://milvus.io/docs
开源仓库地址：https://github.com/milvus-io/milvus

当前定位

Milvus 是当前方案在大规模阶段的向量检索演进底座，适合更高规模知识库和更高吞吐检索场景。

主要职责

大规模向量索引
高吞吐向量检索
大规模知识库检索支撑

与其他组件关系

与 LlamaIndex 配合，用于承接更大规模的索引和查询负载。
与 Weaviate 的关系是条件演进项，而不是默认并行双底座。
依赖模型层提供 Embedding 能力，并向编排层和知识服务输出检索结果。
需要与治理层和数据层联动，保证索引来源、权限与生命周期一致。

适合场景

大规模企业知识库
高并发智能体检索
对向量检索吞吐和隔离要求更高的场景

边界

不作为当前默认检索底座
不替代对象存储和关系数据库

采用规则

只有在知识规模、检索吞吐、资源隔离或多租户压力明显超出默认底座能力时，才评估引入 Milvus。
引入 Milvus 前，需要先证明现有 Weaviate 方案已成为明显瓶颈，而不是为了“技术先进”提前扩张栈。
不建议在同一阶段长期维持两套主向量底座并行承担同类职责。

治理注意点

底座切换前要完成召回、时延、成本和运维复杂度评估。
索引迁移和重建需要可回滚方案，避免知识服务整体中断。
大规模检索场景下要特别关注租户隔离、容量规划和热点查询治理。
所有检索结果仍需继承统一权限过滤和引用追踪规则。

1. 用户与渠道层

2. 统一接入与流量治理层

3. 门户与应用层

4. Agent 编排层

5. 数据治理层

6. 知识与检索层

7. 模型网关与推理层

8. 治理与观测层

9. 基础设施层

Milvus

当前定位

主要职责

与其他组件关系

适合场景

边界

采用规则

治理注意点

关联文档

参考资料

Milvus ​

当前定位 ​

主要职责 ​

与其他组件关系 ​

适合场景 ​

边界 ​

采用规则 ​

治理注意点 ​

关联文档 ​

参考资料 ​

Milvus

当前定位

主要职责

与其他组件关系

适合场景

边界

采用规则

治理注意点

关联文档

参考资料