Zilliz Cloud 定价

按需扩展，满足您的安全与合规要求，同时为任何预算提供经济高效的解决方案。估算成本

云市场订阅

Free

适用于探索学习向量数据库的场景或个人项目。

¥0

快速开始

5 GB 存储
每月 250 万免费
vCUs
额度
5 个 Collection

企业版推荐选择

企业级稳定性与安全合规，适用于生产环境应用开发。

¥756 /月起（按量计费）
或包年￥4599 /年起最高节省 ¥4473！

开启 30 天免费试用

99.95% 可用性 SLA
多副本 (Replica) 和弹性伸缩
Private endpoint 和 VPC peering
备份和恢复、监控和告警
集群层级的 RBAC 权限控制、审计日志
如果您需要跨域多副本容灾、PITR；行级别权限（RLS）、CMEK、数据脱敏（Tokenization）；快照 Snapshot，请联系我们

On-demand 计算

NEW

基于零拷贝外部数据运行 Lake 规模的搜索和索引任务。

零拷贝访问外部数据
按需查询任务和系统托管的索引构建
仅按任务实际运行时长付费，无需常驻计算资源

联系我们

BYOC (Bring Your Own Cloud)

适用于需要在自有云环境中部署，且高度注重数据隐私和合规的场景。

支持在多个云平台部署
高级权限控制与数据安全
全部 SaaS Dedicated 集群功能与服务

预约 Demo

对比版本特性

灵活的部署方式

Dedicated

Dedicated 集群为关键业务提供独享的运行环境，确保性能稳定可控。该部署方式适用于持续高并发和低延时的场景，满足生产级工作负载的性能要求。

稳定的性能
通过独享计算单元（CU），避免资源争用，确保持续稳定的性能表现
透明的定价方式
按用量计费，费用清晰可控，轻松管理整体预算
资源可控，支持自定义调整
实现对资源的精细化管理，并可启用高级功能以满足特定业务需求

集群类型

Dedicated 集群提供多样的集群类型满足您的使用场景。CU（Compute Unit）是用于处理数据的基本计算资源。不同类型的 CU 包含了不同的 CPU、内存和存储配置。

性能型

适用于追求低延时和高吞吐量的应用。

每 CU 容量

200 万向量

搜索 QPS

500-1500

搜索延时

10 毫秒

￥378

每百万向量 / 月

容量型

适用于需要存储大量数据、对延时要求适中的应用。

每 CU 容量

800 万向量

搜索 QPS

100-300

搜索延时

50-100 毫秒

￥95

每百万向量 / 月

分层存储型

适用于超大规模、追求性价比的工作负载。

每 CU 容量

4000 万向量

搜索 QPS

10-50

搜索延时

100-1000 毫秒

￥28

每百万向量 / 月

*该表基于对 768 维向量的评估

对比版本特性

Free
免费试用
Serverless
免费试用
Dedicated企业版
免费试用

部署

部署
环境	Shared	Shared	Dedicated
集群类型
性能型适用于追求低延时和高吞吐量的应用。以 768 维向量为基准估计，可支持 200 万个向量。
容量型适用于需要存储大量数据、对延时要求适中的应用。以 768 维向量为基准估计，可支持 800 万个向量。
分层存储型适用于超大规模、追求性价比的工作负载。以 768 维向量为基准估计，可支持 4000 万个向量。
云服务提供商	阿里云	阿里云	阿里云、腾讯云、亚马逊云科技
灵活可扩展		系统自动伸缩（无需配置）	可配置弹性伸缩自助式一键扩缩至 256 CU 或以上
服务可用性 SLA			99.95%

高可用

数据服务

数据管理

数据安全与合规

数据安全与合规
CMEK			联系我们
MFA
审计系统
API 密钥管理
数据传输加密和静态加密
备份与恢复
跨区域备份
持续数据保护			联系我们
PITR			联系我们
数据脱敏			联系我们
IP 地址访问控制
VPC 私网连接（Private Link）
ISO/ICE 27001、GDPR 合规与安全认证
HIPPA 合规

可观测性

基于角色的访问控制（RBAC）

基于角色的访问控制（RBAC）
组织与项目层级管理	支持单个组织支持单个项目	支持单个组织支持至多 10 个项目	支持单个组织支持至多 10 个项目
组织和项目层级 RBAC
数据层 RBAC

集成与工具

技术支持

技术支持
值守支持	工作时间	全天候
首次响应 SLA
紧急问题	4 小时	1 小时
高优先级问题	1 个工作日	4 小时
中等/一般问题	2 个工作日	1 个工作日
支持渠道
社区支持
技术支持 Bot
邮件或工单
微信
飞书/腾讯/钉钉会议
架构指导
通用
特殊案例
在线咨询

估算成本

使用价格计算器估算您的使用成本。

云服务提供商

地域

集群类型

Entity 数量

每个 Entity 代表一行数据。例如，一个 Entity 可以代表一张图片或一段文档片段。

百万

向量维度

向量维度是指向量的长度。根据您使用的 Embedding 模型，输出的向量维度会有所不同。

向量数据类型

Replica

mmap

通过开启 mmap（内存映射）优化内存使用，可提升相同 Query CU 可存放的数据量。了解更多

计费类型

预估每月总价

使用 ¥300 优惠券实测成本

计算器显示的价格仅为估算结果，实际价格可能会有所差异。建议您使用优惠券进行成本实测或联系我们获取定制化的成本优化方案和 PoC 资源。

Query CU
* 1 Replica
¥
GB
存储
¥

免费试用联系我们

常见问题

什么是计算单元（Compute Unit, CU）?
计算单元（CU）是指用于提供向量检索、分析服务的一组硬件资源。可以将 CU 视为一个物理查询节点。
什么是 vCU？
vCU 是用于衡量读取（如 search、query）和写入操作（如 insert、upsert、delete）所消耗资源的基本单位。读取和写入操作基于 vCU 用量会有所不同。
我应该选择哪种集群类型？
如果您的应用需要低延迟和高吞吐量，建议选择性能型。
如果您需要存储大量数据，但对吞吐量和延迟的要求较低，建议选择容量型。
如果您需要处理超大规模的数据、追求性价比的工作负载，建议选择分层存储型。
我的数据需要使用多少 Query CU
性能型：以 768 维向量为基准估计，可支持 200 万个向量（不包含标量字段）。
容量型：以 768 维向量为基准估计，可支持 800 万个向量（不包含标量字段）。
分层存储型：以 768 维向量为基准估计，可支持 4000 万个向量（不包含标量字段）。

以上数据针对仅包含主键的向量数据。如果您的数据中含有其他标量字段，如 ID 或 label，可能需要使用更多 Query CU。我们建议进行测试以准确评估数据实际需要使用的 Query CU。
我应该选择哪种计费方式的 Dedicated 集群？
按量计费:先使用后付费，按照集群实际用量每小时计费，按月结算。按量计费的模式相对更灵活，适用于业务波动较大，无法预估资源使用情况的场景。
包年包月:先付费后使用，按照集群订单中的购买时长进行结算。包年包月的模式相对更优惠，适用于业务较为稳定，需要长期使用资源的场景。包年包月的购买时长越长，折扣越大。
有关两种计费方式之间的具体差异，请参考包年包月 vs 按量计费。
如何获取技术支持？
如需获取技术支持，请通过 https://support.zilliz.com.cn/hc/zh-cn 提交工单。

数据服务
Vector Search
Filtered Search
Range Search
Grouping Search
Hybrid Search
全文搜索
精确文本匹配
Query
数据处理

数据管理
跨集群迁移		从 Free 集群迁移
在线迁移
从外部数据源迁移
Stage
高速数据传输
回收站

可观测性
细粒度的指标与实时监控面板
告警
集成第三方监控告警系统和 API
任务中心

集成与工具
管控面和数据面 RESTful API
多语言 SDK	Python、Java、Go、Node.js SDK	Python、Java、Go、Node.js SDK	Python、Java、Go、Node.js SDK
VTS（向量传输服务）
VectorDBBench

高可用
可用区	单个	多个
多副本（Replica）
快照 Snapshot
Global Cluster

Zilliz Cloud 定价

Free

企业版推荐选择

On-demand 计算

BYOC (Bring Your Own Cloud)

灵活的部署方式

Dedicated

稳定的性能

透明的定价方式

资源可控，支持自定义调整

集群类型

性能型

容量型

分层存储型

对比版本特性

Free

Serverless

Dedicated企业版

估算成本

Entity 数量

向量维度

mmap

AI Assistant