用 KubeBlocks 管理 Milvus
生成式人工智能的爆火引发了人们对向量数据库的关注。目前,KubeBlocks 支持 Milvus 的管理和运维。本文档展示如何使用 KubeBlocks 管理 Milvus。
Milvus 是高度灵活、可靠且速度极快的云原生开源矢量数据库。它为 embedding 相似性搜索和 AI 应用程序提供支持,并努力使每个组织都可以访问矢量数据库。 Milvus 可以存储、索引和管理由深度神经网络和其他机器学习 (ML) 模型生成的十亿级别以上的 embedding 向量。
开始之前
创建集群
步骤:
1.创建一个 Milvus 集群。
如需管理其他向量数据库,可将 cluster-definition 的值更改为其他的数据库。
kbcli cluster create milvus --cluster-definition=milvus-2.3.2
2.检查集群是否已创建。
code block
3.查看集群信息。
kbcli cluster describe milvus
扩缩容
当前,KubeBlocks 支持垂直扩缩用 Milvus 集群。
执行以下命令进行垂直扩缩容。
kbcli cluster vscale milvus --cpu=1 --memory=1Gi --components=milvus
这里需要等待几秒钟,直到扩缩容完成。
kbcli cluster vscale 命令会打印输出 opsname。执行以下命令检查扩缩容进度:
查看扩缩容是否已经完成。
kbcli cluster describe milvus
磁盘扩容
步骤:
kbcli cluster volume-expand milvus --storage=40Gi --components=milvus
这里需要等待几分钟,直到磁盘扩容完成。
kbcli cluster volume-expand 命令会打印输出 opsname。执行以下命令检查磁盘扩容进度:
kbcli cluster describe-ops milvus-volumeexpansion-5pbd2 -n default
查看磁盘扩容是否已经完成。
kbcli cluster describe milvus
重启
重启集群。
配置 --components 和 --ttlSecondsAfterSucceed 的值,重启指定集群。
code block
--components 表示需要重启的组件名称。
--ttlSecondsAfterSucceed 表示重启成功后 OpsRequest 作业的生存时间。
验证重启操作。
执行以下命令检查集群状态,并验证重启操作。
milvus default milvus-2.3.2 milvus-2.3.2 Delete Running Jul 05,2024 18:35 UTC+0800
STATUS=Updating 表示集群正在重启中。 STATUS=Running 表示集群已重启。 停止/启动集群 你可以停止/启动集群以释放计算资源。当集群被停止时,其计算资源将被释放,也就是说 Kubernetes 的 Pod 将被释放,但其存储资源仍将被保留。如果你希望通过快照从原始存储中恢复集群资源,请重新启动该集群。
停止集群
配置集群名称,并执行以下命令来停止该集群。
kbcli cluster stop milvus
查看集群状态,确认集群是否已停止。
code block
启动集群
1.配置集群名称,并执行以下命令来启动该集群。
code block
2.查看集群状态,确认集群是否已再次运行。
code block
本文章由KubeBlocks投稿,原文链接: https://cn.kubeblocks.io/docs/preview/user-docs/kubeblocks-for-milvus/manage-milvus/
技术干货
Milvus 跨集群数据迁移
将 milvus 数据从 A 集群(K8S集群)迁到 B 集群(K8S集群),解决方案很多,这里提供一个使用官方 milvus-backup 工具进行数据迁移的方案。
2024-08-08技术干货
如何检测和纠正GenAI模型中的逻辑谬误
随着LLM的使用和采用不断增长,我们需要解决一个关键问题:LLM输出中的逻辑谬误。解决这一挑战,使AI系统更具责任感和可信度至关重要。
2024-07-26技术干货
高级检索增强生成(RAG)应用与LlamaIndex
在最近由Zilliz(旧金山)主办的非结构化数据聚会上,LlamaIndex的开发者关系副总裁Laurie Voss发表了一场关于“使用LlamaIndex构建高级RAG应用”的演讲。他分享了如何使检索增强生成(RAG)框架更简单、更易于生产准备的知识,并通过LlamaIndex实现。
2024-07-26