Zilliz Cloud 定价

按需扩展,满足您的安全与合规要求,同时为任何预算提供经济高效的解决方案。 估算成本

云市场订阅

阿里云
腾讯云
亚马逊云科技

Free

适用于探索学习向量数据库的场景或个人项目。

¥0
快速开始
  • 5 GB 存储
  • 每月 250 万免费
    vCUs
    额度
  • 5 个 Collection

企业版

推荐选择

企业级稳定性与安全合规,适用于生产环境应用开发。

¥756 /月起(按量计费)
或包年¥4599 /年起最高节省 ¥4473!
开启 30 天免费试用
  • 99.95% 可用性 SLA
  • 多副本 (Replica) 和弹性伸缩
  • Private endpoint 和 VPC peering
  • 备份和恢复、监控和告警
  • 集群层级的 RBAC 权限控制、审计日志
  • 如果您需要跨域多副本容灾、PITR;行级别权限(RLS)、CMEK、数据脱敏(Tokenization);快照 Snapshot,请联系我们

BYOC (Bring Your Own Cloud)

适用于需要在自有云环境中部署,且高度注重数据隐私和合规的场景。

联系我们
预约 Demo
  • 支持在多个云平台部署
  • 高级权限控制与数据安全
  • 全部 SaaS Dedicated 集群功能与服务

灵活的部署方式

Dedicated

Dedicated 集群为关键业务提供独享的运行环境,确保性能稳定可控。该部署方式适用于持续高并发和低延时的场景,满足生产级工作负载的性能要求。

  • 稳定的性能

    通过独享计算单元(CU),避免资源争用,确保持续稳定的性能表现

  • 透明的定价方式

    按用量计费,费用清晰可控,轻松管理整体预算

  • 资源可控,支持自定义调整

    实现对资源的精细化管理,并可启用高级功能以满足特定业务需求

集群类型

Dedicated 集群提供多样的集群类型满足您的使用场景。CU(Compute Unit)是用于处理数据的基本计算资源。不同类型的 CU 包含了不同的 CPU、内存和存储配置。

性能型

适用于追求低延时和高吞吐量的应用。

每 CU 容量

150 万向量

搜索 QPS

500-1500

搜索延时

10 毫秒

¥504

每百万向量 / 月

容量型

适用于需要存储大量数据、对延时要求适中的应用。

每 CU 容量

500 万向量

搜索 QPS

100-300

搜索延时

50-100 毫秒

¥151

每百万向量 / 月

分层存储型

适用于超大规模、追求性价比且数据访问具有明显冷热特征的工作负载。

每 CU 容量

2000 万向量

热存储访问

搜索 QPS

100-150

搜索延时

20-40 毫秒

冷存储访问

搜索 QPS

5-20

搜索延时

200-1000 毫秒

¥55

每百万向量 / 月

*该表基于对 768 维向量的评估

对比版本特性

部署
部署
环境SharedSharedDedicated
集群类型
性能型适用于追求低延时和高吞吐量的应用。以 768 维向量为基准估计,可支持 150 万个向量。
容量型适用于需要存储大量数据、对延时要求适中的应用。以 768 维向量为基准估计,可支持 500 万个向量。
分层存储型适用于超大规模、追求性价比且数据访问具有明显冷热特征的工作负载。每个查询 CU 可处理约 2000 万条 768 维向量。
云服务提供商阿里云阿里云阿里云、腾讯云、亚马逊云科技
灵活可扩展
系统自动伸缩
(无需配置)
可配置弹性伸缩
自助式一键扩缩至 256 CU 或以上
服务可用性 SLA
99.95%

估算成本

使用价格计算器估算您的使用成本。

云服务提供商
地域
集群类型
Entity 数量
每个 Entity 代表一行数据。例如,一个 Entity 可以代表一张图片或一段文档片段。
1
百万
向量维度
向量维度是指向量的长度。根据您使用的 Embedding 模型,输出的向量维度会有所不同。
768

Replica

mmap

通过开启 mmap(内存映射)优化内存使用,可提升相同 Query CU 可存放的数据量。了解更多

计费类型

预估每月总价

¥

使用 ¥300 优惠券实测成本

计算器显示的价格仅为估算结果,实际价格可能会有所差异。建议您使用优惠券进行成本实测或联系我们获取定制化的成本优化方案和 PoC 资源。

  • Query CU

    *  1 Replica

    ¥

  • GB

    存储

    ¥

常见问题

  • 什么是计算单元(Compute Unit, CU)?

    计算单元(CU)是指用于提供向量检索、分析服务的一组硬件资源。可以将 CU 视为一个物理查询节点。
  • 什么是 vCU?

    vCU 是用于衡量读取(如 search、query)和写入操作(如 insert、upsert、delete)所消耗资源的基本单位。读取和写入操作基于 vCU 用量会有所不同。
  • 我应该选择哪种集群类型?

    如果您的应用需要低延迟和高吞吐量,建议选择性能型。
    如果您需要存储大量数据,但对吞吐量和延迟的要求较低,建议选择容量型。
    如果您需要处理超大规模、追求性价比且数据访问具有明显冷热特征的工作负载,建议选择分层存储型。
  • 我的数据需要使用多少 Query CU

    性能型: 以 768 维向量为基准估计,可支持 150 万个向量(不包含标量字段)。
    容量型: 以 768 维向量为基准估计,可支持 500 万个向量(不包含标量字段)。
    分层存储型: 以 768 维向量为基准估计,可支持 2000 万个向量(不包含标量字段)。

    以上数据针对仅包含主键的向量数据。如果您的数据中含有其他标量字段,如 ID 或 label,可能需要使用更多 Query CU。我们建议进行测试以准确评估数据实际需要使用的 Query CU。
  • 我应该选择哪种计费方式的 Dedicated 集群?

    按量计费:先使用后付费,按照集群实际用量每小时计费,按月结算。按量计费的模式相对更灵活,适用于业务波动较大,无法预估资源使用情况的场景。
    包年包月:先付费后使用,按照集群订单中的购买时长进行结算。包年包月的模式相对更优惠,适用于业务较为稳定,需要长期使用资源的场景。包年包月的购买时长越长,折扣越大。
    有关两种计费方式之间的具体差异,请参考包年包月 vs 按量计费
  • 如何获取技术支持?

    如需获取技术支持,请通过 https://support.zilliz.com.cn/hc/zh-cn 提交工单。

AI Assistant