Skip to content

Milvus

类型:大规模向量检索演进底座

复用规则:条件引入的组件说明页

所属层:知识与检索层

官方网站:https://milvus.io/docs

开源仓库地址:https://github.com/milvus-io/milvus

当前定位

Milvus 是当前方案在大规模阶段的向量检索演进底座,适合更高规模知识库和更高吞吐检索场景。

主要职责

  • 大规模向量索引
  • 高吞吐向量检索
  • 大规模知识库检索支撑

与其他组件关系

  • LlamaIndex 配合,用于承接更大规模的索引和查询负载。
  • Weaviate 的关系是条件演进项,而不是默认并行双底座。
  • 依赖模型层提供 Embedding 能力,并向编排层和知识服务输出检索结果。
  • 需要与治理层和数据层联动,保证索引来源、权限与生命周期一致。

适合场景

  • 大规模企业知识库
  • 高并发智能体检索
  • 对向量检索吞吐和隔离要求更高的场景

边界

  • 不作为当前默认检索底座
  • 不替代对象存储和关系数据库

采用规则

  • 只有在知识规模、检索吞吐、资源隔离或多租户压力明显超出默认底座能力时,才评估引入 Milvus
  • 引入 Milvus 前,需要先证明现有 Weaviate 方案已成为明显瓶颈,而不是为了“技术先进”提前扩张栈。
  • 不建议在同一阶段长期维持两套主向量底座并行承担同类职责。

治理注意点

  • 底座切换前要完成召回、时延、成本和运维复杂度评估。
  • 索引迁移和重建需要可回滚方案,避免知识服务整体中断。
  • 大规模检索场景下要特别关注租户隔离、容量规划和热点查询治理。
  • 所有检索结果仍需继承统一权限过滤和引用追踪规则。

关联文档

参考资料

Open-source first, enterprise-ready.