Zilliz Cloud 发布新功能:迁移服务、Fivetran Connector、多副本 Replica
我们很高兴宣布,Zilliz Cloud 发布一系列新特性,旨在增强生产级 AI 应用。这次更新为开发者带来了更多先进的工具,帮助开发者更高效地部署和扩展 AI 应用。
新特性可以通过以下几个方面为技术团队赋能:
- 利用先进技术,高效处理非结构化数据
- 满足大规模生产级 GenAI 应用的速度和可扩展性要求
- 确保生产级 GenAI 应用的稳定性和安全性
随着越来越多组织部署 AI 应用,管理大量非结构化数据、确保高性能和可扩展性、维护操作的稳定性成为关键挑战。Zilliz Cloud 的新特性有效解决了这些问题,使得开发团队能够专注于开发和创新而非管理基础设施。
以下为本次发布的新特性列表。请继续阅读,了解详情。
- 迁移服务
- Fivetran Connector
- 多副本(Multi-Replica)
- 弹性伸缩
- 其他生产就绪(Production- ready)新功能 图1:Zilliz Cloud 2024 年 9 月发布特性概览
迁移服务:安全高效的向量数据迁移服务
Zilliz Cloud 推出了针对向量数据的迁移服务,旨在解决开发者在 AI 应用中使用向量数据库时面临的关键挑战。随着项目的开发和推进,开发人员出于以下原因,常常会需要在数据库和其他数据系统之间迁移向量数据:
- 避免供应商锁定
- 实施健全的数据备份和恢复策略
- 确保不同系统之间的互通性
然而,这个迁移过程通常比预期的要更复杂,迁移过程中也会面临数据丢失的风险。
Zilliz Cloud 迁移服务通过提供以下几个方面简化了数据迁移流程:
- 在向量数据库之间进行无损数据迁移(例如,Milvus、pgvector、Elasticsearch)
- 支持批量导入和增量数据迁移
- 内置数据验证能力以确保数据一致性
- 专为处理大规模向量数据而设计的高性能操作
通过迁移服务,开发者可以在不同平台和场景下完全控制数据。Zilliz Cloud 迁移服务简化了迁移流程,使得您能够专注于构建和改进您的 AI 模型和应用,同时确保数据的可移植性、安全性和完整性。
Fivetran Connector:简化非结构化数据集成流程,支持 500 多种数据来源
Zilliz Cloud 现与 Fivetran 集成,显著扩展了数据摄取(Ingestion)能力。通过 Fivetran Connector 能够实现高效检索来自 500 多个不同系统(如 Snowflake、MongoDB、Salesforce 等)的非结构化数,从而扩大了 AI 应用可访问数据的范围。
Fivetran Connector 的工作原理如下:
- 来自 500 多个数据源的非结构化数据流入 Fivetran
- Fivetran 的 Connector 和转换逻辑处理数据
- 使用 Fivetran SDK 构建的 Milvus source connector 将处理后的数据传输到 Zilliz Cloud 或 Milvus
- 通过 OpenAI Fivetran Connector 中的 OpenAI Embedding Services 将非结构化数据转换为向量
- 最后,向量数据被 ingest 到 Zilliz Cloud 或 Milvus 中,可用于后续的向量搜索。
图2:Fivetran source Connector 工作原理
Fivetran 的集成简化了从多个来源获取非结构化数据并转换为向量的整个流程,免去了定制 ETL 流水线(Pipeline)的麻烦,节省了开发者的时间和精力,同时确保了数据丝滑流入 Milvus 或 Zilliz Cloud。
通过利用 Fivetran Connector,您可以轻松地使用大量非结构化数据构建您的 AI 应用程序,推动语义搜索和人工智能领域发展。 多副本(Multi-replica):提升性能和可用性
新推出的多副本功能(公测版)增强了 Zilliz Cloud 在生产环境中的能力。这一特性支持针对集群创建 Replica,显著提高了查询性能和系统的可用性。
许多面向消费者的生产级 AI 应用在面对大量用户查询时,会遇到 QPS 瓶颈。多副本功能通过在多个 Replica 之间分配查询负载来解决 QPS 瓶颈问题,实现并行处理。增加 Replica 数量可以线性提高整体 QPS、减少延时并提升效率,从而保障高流量生产级应用的响应能力。
此外,多副本通过在多个可用区(AZ)之间分布 Replica 来增强系统的可靠性。这种架构确保即使在 AZ 故障期间也能持续访问数据,为应用提供高可用性。虽然多副本不会增加集群的整体容量,但它能够优化查询性能并确保生产环境中所需的系统弹性,帮助技术团队更安心地扩展 AI 应用。
弹性伸缩:动态管理集群容量
Zilliz Cloud 本次发布中推出的弹性伸缩(内测版)功能,旨在解决生产环境中一个常见的挑战——根据波动的需求动态管理集群容量。弹性伸缩功能实现了根据实时用量动态调整集群容量,能够防止因资源不够而导致的禁写,并帮助开发者降低运营成本。
Zilliz Cloud 会每隔 1 分钟检查 CU 加载容量指标。如果在过去 2 分钟内,每个指标采集点的值均超过设置的阈值(默认值为 70%,可按需调整) ,Zilliz Cloud 会自动进行扩容。开发者可以设置集群弹性扩缩时的最大 CU 规格,从而控制资源分配和成本。
注意:弹性伸缩功能目前仅针对 Dedicated(企业版)集群开放,且处于内测阶段。如有兴趣尝试此功能,请联系我们。
其他新功能
Zilliz Cloud 还推出了以下功能以增强生产级应用:
- 可用性:为 AI 应用提供 99.95% 的 SLA。
- 监控和告警:
- 39 个组织和项目级别的告警,用于管理成本和性能。
- 18 个关键指标,涵盖资源使用情况、QPS、请求结果和数据操作等。
- 可定制的数据图表,用于深入分析系统健康状况。
- Zilliz Cloud 新开区——亚马逊云科技 中国(宁夏)。这一更新为我们国内地区的用户提供更低延时、更出色的性能和更严格的数据控制。
这些特性为开发者提供了工具,从而维护生产级 AI 应用的高性能、安全性且成本效益。
使用 Zilliz Cloud 搭建生产级 AI 应用
Zilliz Cloud 发布的新功能旨在增强您在生产环境中构建和维护强大 AI 应用的能力。从安全高效的数据迁移到动态扩展和完善的监控指标,这些新特性解决了开发者在搭建生产级 AI 应用时常常面临的关键挑战。
想要立刻使用 Zilliz Cloud?免费开启您的 Zilliz Cloud 之旅——无需安装任何程序,也无需绑定支付方式。首次注册 Zilliz Cloud 账号还可享受 30 天免费试用,获赠 ¥300 免费额度!
如果在探索 Zilliz Cloud 过程中遇到任何问题或需要帮助,欢迎联系我们的技术支持团队。您可以通过 Zilliz Cloud 技术支持中心提交工单。我们十分乐意帮助您使用这些新功能搭建 AI 应用和服务。
欢迎立刻使用 Zilliz Cloud 搭建生产级 AI 应用!