向量数据库博客
学习技术干货,参考用户案例,了解公司动态及社区活动。探索海量向量数据库内容。
技术干货
Milvus × 百易图:霸榜中东的 APP 是如何炼成的
高质量的内容推荐是 JACO 能迅速占领中东市场的关键,Milvus的高效检索提供了强大助力。
技术干货
Milvus×Dify半小时轻松构建RAG系统
本文将通过在Dify平台上使用Milvus,带领大家构建一个高效的RAG系统,探索向量数据库的实际应用场景。
技术干货
RAG开发中,如何用Milvus 2.5 BM25算法实现混合搜索
本文讲述了Milvus 2.5中引入的Sparse-BM25基础原理,以及如何利用BM25算法实现RAG开发中的Hybrid Search(混合搜索)实践。通过引入Sparse-BM25算法,Milvus能够在稀疏向量上执行高效的全文检索,并与密集向量搜索相结合,提升检索的召回率和精确度。
用户案例
降本50%以上,Zilliz助力豆神打造因材施教的AI教育平台
通过使用向量数据库和知识图谱技术,豆神教育有效解决了大模型的幻觉问题,显著提升了教育产品的精准度。
技术干货
如何平衡向量检索速度和精度?深度解读HNSW算法
在本文,我们将介绍一个基于Hierarchical Navigable Small World(HNSW)算法实现的HNSWlib的向量检索库。
技术干货
Late Chunking×Milvus:如何提高RAG准确率
在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分块,滑动窗口重新采样,递归分块,基于内容语义分块等方法。而Jina AI提出的Late Chunking从另外一个角度来处理分块问题,让我们来具体看看。
技术干货
外行如何速成专家?Embedding之BM25、splade稀疏向量解读
稠密向量(Dense Vector)的维度较低,一般在几百到上千左右,每个维度的元素一般都不为零。相对的,还有一种稀疏向量(Sparse Vector),它的维度远远超过稠密向量,一般有几万甚至十万,但是大部分维度的元素都为零,只有少数元素是非零的。
技术干货
开源向量数据库性能对比: Milvus, Chroma, Qdrant
为应对公司在大规模文本、图像等非结构化数据处理上的业务增长需求,笔者着手调研当前流行的开源向量数据库。主要针对查询速度、并发度和召回率这几大核心维度进行深入分析,以确保选定的数据库方案能够在实际业务场景中高效应对大规模数据检索和高并发需求。通过全面对比不同数据库的表现,得出可靠的调研结论。
用户案例
稳!Zilliz助力XTransfer基于RAG打造B2B外贸金融加速器
XTransfer基于RAG(Retrieval-Augmented Generation)技术,将向量数据库Zilliz Cloud的强大向量检索能力与AI大模型的综合理解能力相结合。依托企业长期沉淀下来的知识资产构建AI知识库,实现了知识的高效检索和输出,并支持多种应用场景,包括智能问答、实时辅助、离线学习等,为业务提效发挥了极大的促进作用。