一、 产品概述
1.1 产品介绍
Milvus 作为一款开源的高性能向量数据库,具有出色的向量检索性能、高扩展性和易用性,在人工智能、机器学习、计算机视觉、自然语言处理等领域展现出了巨大的应用潜力。目标市场可以根据应用领域细分为自然语言处理、计算机视觉、推荐系统等多个市场。其客户群体主要包括互联网、电商、金融、医疗、安防等行业的企业,以及科研机构和高校等。
1.2 产品核心能力
Milvus 的核心能力是作为一个高性能、高扩展性的云原生向量数据库,专门为处理大规模非结构化数据和支持人工智能应用而设计。 它的能力主要围绕高效的向量相似性搜索展开,具体体现在以下几个方面:
1. 高效的向量搜索与检索
(1) 大规模相似性搜索(ANN): 能够从数十亿甚至千亿级的高维向量数据集中,快速、准确地找到与查询向量最相似的 K 个向量(K-近邻搜索)。
(2) 异构计算支持 (Knowhere): Milvus 的核心向量执行引擎Knowhere 能够集成并优化各种流行的向量相似性搜索库(如 Faiss, Hnswlib, Annoy),并能控制在 CPU 或 GPU 上执行索引构建和搜索请求,以充分利用硬件能力。
(3) 多样化的搜索模式: 除了基础的 ANN 搜索,还支持过滤搜索(基于标量字段的条件过滤)、范围搜索和混合搜索(结合向量和标量数据),极大地满足了复杂的业务检索需求。
2. 高性能与底层优化
(1) C++ 搜索引擎: 使用 C++ 语言实现核心搜索引擎组件,以实现高性能、底层优化和高效的资源管理。
(2) 硬件感知优化: 集成了汇编级向量操作、多线程并行化和调度等优化,最大限度地利用硬件性能。
(3) 面向列的存储 (Column-Oriented): 采用面向列的数据库系统,在执行查询时只读取涉及的特定字段,大大减少了数据访问量,并有利于向量化操作。
3. 灵活的功能与应用支撑
(1) 多模态检索: 结合 AI 推理和 Embedding 模型,高效索引和检索图片、视频、文本、声纹等多种非结构化数据。
(2) 数据导入与管理: 支持高通量数据导入,并提供数据分片、分区键、可调一致性模型等管理功能。
1.3 产品优势
本产品可以为客户提供一键式的 Milvus 应用部署体验,省去繁琐的部署过程快速赋能人工智能、机器学习、计算机视觉、自然语言处理等领域的应用。
更多产品使用具体方法请下载附件查看。