重磅推出:Milvus Lite 正式上线,几秒内即可轻松搭建 GenAI 应用
和超薄笔记本一样轻便、强大的 Milvus Lite 正式上线!
Milvus Lite(https://milvus.io/docs/milvus_lite.md)是一个轻量级向量数据库,支持本地运行,可用于搭建 Python 应用,由 Zilliz 基于全球最受欢迎的开源向量数据库 Milvus(https://milvus.io/intro)研发。从架构上,Milvus Lite 复用了 Milvus 向量索引和查询解析的核心组件,同时移除了 Milvus 中专为分布式系统高扩展性设计的组件。这种架构设计使 Milvus Lite 变为一种紧凑且高效的向量数据库解决方案,非常适用于计算资源有限的环境,如笔记本电脑、Jupyter Notebook 和移动设备等。
Milvus Lite 支持与 LangChain、LlamaIndex 等 AI 开发栈集成。开发人员无需设置后台服务即可直接使用 Milvus Lite 作为检索增强生成 (RAG) Pipeline 中的向量存储(Vector Store)模块。换言之,只需运行 pip install pymilvus
(2.4.3 版本或以上)即可轻松将 PyMilvus 作为 Python 库集成到您的 AI 应用程序中。
值得一提的是,Milvus Lite 与 Milvus 共享同一套 API,以确保您的客户端代码既适用于小规模的本地部署,也适用于生产环境中大规模(十亿级数据)的 Docker 或 Kubernetes 部署。为了方便大家了解 Milvus Lite,6 月 4 日(周二)晚 8 点,Zilliz 高级 AI 平台开发工程师姜俊杰将为大家在直播间详细拆解 Milvus Lite,报名地址参见(https://3672000551325.huodongxing.com/event/5758114520500)。
01.为什么要研发 Milvus Lite?
许多 AI 应用都需要借助向量相似性搜索的力量来分析处理文本、图像、声音和视频等众多非结构化数据。典型的此类 AI 应用包括聊天机器人、购物助手等。而这些应用,尤其是 RAG 应用的 AI 开发栈中最核心的部分就是用于存储和搜索 Embedding 向量的向量数据库。
虽然业内已有众多向量搜索解决方案,但始终缺乏一种轻量、便于快速上手但也适用于大规模生产部署的方案。在此背景下,我们作为 Milvus 背后的研发团队,设计并推出了 Milvus Lite,旨在帮助 AI 开发人员更快捷地搭建原型(Prototype)、更顺畅地过渡到部署在 Kubernetes 的 Milvus 集群或全托管云服务中的大规模生产级应用。
Milvus Lite 是 Milvus 生态系统中非常重要的一种新增部署模式,为开发人员提供了一款支持开发过程中每个阶段的多功能工具。从原型设计到生产环境部署,不论是边缘计算还是大规模部署,Milvus 是业内目前唯一一个能够覆盖各种规模和开发阶段的向量数据库。
02.如何使用 Milvus Lite?
Milvus Lite 支持 Milvus 中的所有基本操作,如创建 Collection、插入、搜索、删除向量等。后续,Milvus Lite 将快速迭代并支持混合搜索等高级功能。Milvus Lite 会将数据加载到内存中以进行高效搜索,并将数据持久化为 SQLite 文件。
Milvus Lite 包含在 Milvus 的 Python SDK (https://github.com/milvus-io/pymilvus)中,因此仅需运行pip install pymilvus
即可快速部署 Milvus Lite。我们通过以下代码介绍如何设置 Milvus Lite 向量数据库。设置过程中,我们只需要指定一个本地文件名,然后创建一个新 Collection 即可。对于熟悉 Milvus API 的老用户来说,代码中唯一的区别就是 uri 是一个本地文件的名称(如“milvus_demo.db”)而不是 Endpoint (“http://localhost:19530”)。此外,Milvus Lite 同样支持动态列或指定 Schema,可以将原始文本或标签作为元数据存储。
from pymilvus import MilvusClient
client = MilvusClient("milvus_demo.db")
# This collection can take input with mandatory fields named "id", "vector" and
# any other fields as "dynamic schema". You can also define the schema explicitly.
client.create_collection(
collection_name="demo_collection",
dimension=384 # Dimension for vectors.
)
您只需将上述代码中的uri
更换为服务端 Endpoint 即可轻松将 Milvus Lite 搭建的本地应用扩展为部署在 Kubernetes 或 Docker 上的大规模应用。
03.与 AI 开发工具的集成
除了具备快速上手的特点外,Milvus Lite 与 Milvus 一样还支持与许多 AI 开发栈中的项目进行集成,例如 LangChain、LlamaIndex、Haystack、Voyage AI、Ragas、Jina AI、DSPy、BentoML、WhyHow、Relari AI、Airbyte、HuggingFace、MemGPT 等。 这些 项目均提供多样的工具和服务,因此可以为您简化需要使用向量搜索的 AI 应用的开发流程。
后续,我们还将支持集成更多 AI 项目和工具,敬请期待!
04.更多资源及用例
欢迎查看 Milvus 快速开始文档(https://milvus.io/docs/quickstart.md)学习如何使用或阅读教程了解如何使用 Milvus Lite 搭建 RAG、图像搜索等 AI 应用。当然,也别忘了预约 Zilliz 官方视频号下周二晚 8 点的直播,Zilliz 的工程师将手把手带你玩转 Milvus Lite!
技术干货
我决定给 ChatGPT 做个缓存层 >>> Hello GPTCache
我们从自己的开源项目 Milvus 和一顿没有任何目的午饭中分别获得了灵感,做出了 OSSChat、GPTCache。在这个过程中,我们也在不断接受「从 0 到 1」的考验。作为茫茫 AI 领域开发者和探索者中的一员,我很愿意与诸位分享这背后的故事、逻辑和设计思考,希望大家能避坑避雷、有所收获。
2023-4-14技术干货
当一个程序员决定穿上粉裤子
如何找到和你时尚风格相似的明星?AI + Milvus=?
2023-8-23技术干货
LLMs 诸神之战:LangChain ,以【奥德赛】之名
毫无疑问,大语言模型(LLM)掀起了新一轮的技术浪潮,成为全球各科技公司争相布局的领域。诚然,技术浪潮源起于 ChatGPT,不过要提及 LLMs 的技术发展的高潮,谷歌、微软等巨头在其中的作用不可忽视,它们早早地踏入 AI 的技术角斗场中,频频出招,势要在战斗中一争高下,摘取搜索之王的桂冠。而这场大规模的 AI 之战恰好为 LLMs 技术突破奏响了序曲。LangChain 的加入则成为此番技术演进的新高潮点,它凭借其开源特性及强大的包容性,成为 LLMs 当之无愧的【奥德赛】。
2023-5-17