Free
适用于探索学习向量数据库的场景,可轻松升级至其他付费版本。
快速开始- 5 GB可容纳 100 万个 768 维向量。存储
- 每月 250 万免费vCUvCU 是用于衡量读取(如 search、query)和写入操作(如 insert、upsert、delete)所消耗资源的基本单位。额度
- 5 个 Collection
Serverless
适用于查询量不固定或不频繁的 Serverless 应用,无需进行复杂配置即可自动根据业务调整计算资源。
免费试用¥21 / 每百万vCUsvCU 是用于衡量读取(如 search、query)和写入操作(如 insert、upsert、delete)所消耗资源的基本单位。- 按量付费
- 自动伸缩
- 100 个 Collection
Dedicated
适用于生产环境。提供针对不同用例深度优化的 CU 类型、企业级数据安全与合规、监控指标、技术支持 SLA。支持高级配置。
- 联系销售
BYOC
适用于高度注重数据隐私和合规的场景。
- 支持在多个云平台部署
- 保证企业级数据安全
- 高度灵活可扩展
Dedicated 版本提供多样的 CU 类型满足您的使用场景
CU(Compute Unit)是用于处理数据的基本计算资源。不同类型的 CU 包含了不同的 CPU、内存和存储配置。
CU 类型 | 搜索 QPS | 搜索延时 | 每 CU 容量 | 每百万向量费用 | 适用场景 |
---|---|---|---|---|---|
性能型 | 500~1500 | 毫秒级 | 150 万向量 | ¥504 每月 | 适用于追求低延时和高吞吐量的应用。 |
容量型 | 100~300 | 十毫秒级 | 500 万向量 | ¥151 每月 | 适用于需要存储大量数据、对延时要求适中的应用。 |
New!存储扩展型 联系销售 | 5~20 | 百毫秒级 | 2000 万向量 | ¥75 每月 | 适用于需要存储海量数据且追求性价比、对延时要求较低的应用。 |
*该表基于对 768 维向量的评估。
部署 | |||
---|---|---|---|
环境 | Shared | Shared | Dedicated |
CU 类型 | |||
性能型适用于追求低延时和高吞吐量的应用。以 768 维向量为基准估计,可支持 150 万个向量。 | |||
容量型适用于需要存储大量数据、对延时要求适中的应用。以 768 维向量为基准估计,可支持 500 万个向量。 | |||
New!存储扩展型适用于需要存储海量数据且追求性价比、对延时要求较低的应用。以 768 维向量为基准估计,可支持 2000 万个向量。联系销售 | |||
云服务提供商 | 阿里云 | 阿里云 | 阿里云、腾讯云、亚马逊云科技 |
灵活可扩展 零停机为集群进行扩缩容。 | 自动扩缩 | 弹性伸缩 自助式一键扩缩至 256 CU 或以上 | |
服务可用性 SLA 保障生产环境服务可用性。 | 99.95% |
高可用 | |||
---|---|---|---|
可用区 | 单个 | 多个 | |
多副本(Replica) Zilliz Cloud 自动将数据分布在多个云服务提供商和地域之间,采用分布式技术确保所有副本数据一致,在面对故障时会快速切换至其他副本。 |
数据管理 | |||
---|---|---|---|
跨版本数据迁移 轻松从 Free、Serverless 版本迁移。 | 支持从 Serverless 集群迁移 | ||
从外部数据源迁移 轻松将数据从 Milvus、Elasticsearch、PostgreSQL、腾讯云向量数据库、Pinecone、Qdrant 等外部数据源迁移至 Zilliz Cloud。 | |||
高速数据传输 支持从阿里云 OSS 等对象储存服务快速导入数据。 | |||
回收站 删除的 Collection 将被移至回收站并保留 30 天。支持恢复删除数据。 |
数据安全与合规 | |||
---|---|---|---|
MFA | |||
审计系统 全面的审计日志记录控制面的 UI 和 RESTful API 操作以及数据面的 SDK 和 RESTful API 操作。 | |||
API 密钥管理 | |||
数据传输加密和静态加密 | |||
备份与恢复 支持自动或手动创建集群或 Collection 级别的备份。 | |||
IP 地址访问控制 | |||
VPC 私网连接(Private Link) 在您的 VPC 和 Zilliz Cloud VPC 间建立私网连接。 | |||
ISO/ICE 27001、GDPR、HIPPA 合规与安全认证 |
基于角色的访问控制(RBAC) | |||
---|---|---|---|
组织与项目层级管理 组织设置与用户管理。 | 支持单个组织 支持单个项目 | 支持单个组织 支持至多 10 个项目 | 支持单个组织 支持至多 10 个项目 |
组织和项目层级 RBAC 在组织和项目层级提供基于角色的权限访问控制(RBAC)。 | |||
数据层 RBAC 数据层面的 RBAC 能够精准控制 Collection、Partition 层面的资源访问权限以及特定操作权限,有效保障数据安全。 |
可观测性 | |||
---|---|---|---|
细粒度的指标与实时监控面板 包含性能、存储、用量、数据统计等监控指标。 | |||
告警 无缝集成多种告警渠道,包括邮件、短信、飞书、Webhook、企业微信、钉钉等。 | |||
集成第三方监控告警系统和 API 定制化的监控 API 集成 Prometheus、Datadog 等监控平台。 | |||
任务中心 统一的任务管理页面,高效追踪迁移、导入、备份恢复、复制 Collection、创建示例 Collection 等任务的进度。 |
集成与工具 | |||
---|---|---|---|
管控面和数据面 RESTful API | |||
多语言 SDK | Python、Java、Go、Node.js SDK | Python、Java、Go、Node.js SDK | Python、Java、Go、Node.js SDK |
VectorDBBench 一款专为向量数据库设计的开源性能测试工具,可用于比较不同向量数据库间的性能和性价比。 |
技术支持 | |||
---|---|---|---|
社区支持 | |||
全天候邮件支持 | |||
服务响应时间 SLA | |||
紧急问题 | 4 小时 | 1 小时 | |
中等问题 | 1 个工作日 | 4 小时 | |
一般问题 | 2 个工作日 | 1 个工作日 | |
技术支持人员 | 1 名工程师 | 4 名工程师 |
Pipelines | |||
---|---|---|---|
Data source connectors 支持批式和流式导入数据。 | |||
Ingestion pipelines Ingestion pipeline 能够将非结构化数据转换为可搜索的 Embedding 向量,一站式完成文档解析、切片、Embedding、加载、索引等任务。 | |||
Search pipelines Search pipeline 能够搜索相似文本和图像数据,并支持高级检索功能,如稀疏和稠密向量搜索、多阶段召回及重排(Reranking)。 |
Pipelines
一站式 API 服务涵盖数据导入、向量化、检索和重排(Rerank)等多种功能,助力构建高效的搜索应用。Pipelines 提供丰富的开源及第三方模型,支持文件、文本、图像等多种数据类型,为您免去维护复杂检索服务的麻烦。灵活的定价方案,可按需付费。
估算成本
使用价格计算器估算您的使用成本。
云服务提供商
地域
CU 类型
容量型适用于需要存储大量数据、对延时要求适中的应用。以 768 维向量为基准估计,可支持 500 万个向量。
向量数量
向量维度
Replica
预估每月总价
总价 = CU 价格 × Replica 数量 + 存储价格
估算价格按月度估算,但实际按小时计费。您可以随时挂起集群以节省成本。
¥
¥
Replica
1
存储价格
GB存储价格
GB
单价
¥0/GB
¥
注意:价格计算器显示的价格仅为估算结果,实际价格可能会因多种因素(如:您的服务实际使用情况)而有所变化。
常见问题
什么是计算单元(Compute Unit, CU)?
什么是 vCU?
我应该选择哪种 CU 类型?
我的数据需要使用多少 CU?
如何获取技术支持?