Milvus
类型:大规模向量检索演进底座
复用规则:条件引入的组件说明页
所属层:知识与检索层
当前定位
Milvus 是当前方案在大规模阶段的向量检索演进底座,适合更高规模知识库和更高吞吐检索场景。
主要职责
- 大规模向量索引
- 高吞吐向量检索
- 大规模知识库检索支撑
与其他组件关系
- 与 LlamaIndex 配合,用于承接更大规模的索引和查询负载。
- 与 Weaviate 的关系是条件演进项,而不是默认并行双底座。
- 依赖模型层提供 Embedding 能力,并向编排层和知识服务输出检索结果。
- 需要与治理层和数据层联动,保证索引来源、权限与生命周期一致。
适合场景
- 大规模企业知识库
- 高并发智能体检索
- 对向量检索吞吐和隔离要求更高的场景
边界
- 不作为当前默认检索底座
- 不替代对象存储和关系数据库
采用规则
- 只有在知识规模、检索吞吐、资源隔离或多租户压力明显超出默认底座能力时,才评估引入
Milvus。 - 引入
Milvus前,需要先证明现有Weaviate方案已成为明显瓶颈,而不是为了“技术先进”提前扩张栈。 - 不建议在同一阶段长期维持两套主向量底座并行承担同类职责。
治理注意点
- 底座切换前要完成召回、时延、成本和运维复杂度评估。
- 索引迁移和重建需要可回滚方案,避免知识服务整体中断。
- 大规模检索场景下要特别关注租户隔离、容量规划和热点查询治理。
- 所有检索结果仍需继承统一权限过滤和引用追踪规则。
