向量数据库博客

学习技术干货,参考用户案例,了解公司动态及社区活动。探索海量向量数据库内容。

如何选择合适的 Embedding 模型

技术干货

如何选择合适的 Embedding 模型

检索增强生成(RAG)是生成式 AI (GenAI)中的一类应用,支持使用自己的数据来增强 LLM 模型(如 ChatGPT)的知识。 RAG 通常会用到三种不同的AI模型,即 Embedding 模型、Rerankear模型以及大语言模型。本文将介绍如何根据您的数据类型以及语言或特定领域(如法律)选择合适的 Embedding 模型。

2024-08-26
Milvus 跨集群数据迁移

技术干货

Milvus 跨集群数据迁移

将 milvus 数据从 A 集群(K8S集群)迁到 B 集群(K8S集群),解决方案很多,这里提供一个使用官方 milvus-backup 工具进行数据迁移的方案。

2024-08-08
什么是二进制嵌入?

技术干货

什么是二进制嵌入?

尽管密集嵌入因其能够以最小的信息损失保留语义含义而普遍存在,但随着数据量的增加,它们的计算需求和内存需求也在增加。这种增加促使开发者寻求更高效的数据表示方法。

2024-07-26
如何检测和纠正GenAI模型中的逻辑谬误

技术干货

如何检测和纠正GenAI模型中的逻辑谬误

随着LLM的使用和采用不断增长,我们需要解决一个关键问题:LLM输出中的逻辑谬误。解决这一挑战,使AI系统更具责任感和可信度至关重要。

2024-07-26
高级检索增强生成(RAG)应用与LlamaIndex

技术干货

高级检索增强生成(RAG)应用与LlamaIndex

在最近由Zilliz(旧金山)主办的非结构化数据聚会上,LlamaIndex的开发者关系副总裁Laurie Voss发表了一场关于“使用LlamaIndex构建高级RAG应用”的演讲。他分享了如何使检索增强生成(RAG)框架更简单、更易于生产准备的知识,并通过LlamaIndex实现。

2024-07-26
如何实现 Delivery Hero 的 AI 生成图像安全系统

技术干货

如何实现 Delivery Hero 的 AI 生成图像安全系统

在应用程序中附有图像的产品比没有图像的产品更频繁地被订购。具体来说,86% 在应用程序上订购的产品附有图像。在进行 A/B 测试后,他们还发现仅通过为产品添加图像,转化率就增加了 6-8%。这一发现意味着产品图像是顾客在Delivery Hero 应用程序上订购食品之前的关键因素之一。

2024-07-26
Copilot 工作区:它是什么,它如何工作,为什么它很重要

技术干货

Copilot 工作区:它是什么,它如何工作,为什么它很重要

他们介绍了他们的 Copilot 工作区,这是一个新的面向任务的开发环境,建立在 GitHub Copilot 之上。这个开发环境增强了我们如何利用生成性 AI 模型,因为现在我们可以超越简单的代码建议,实现整个功能的实现。在接下来的部分中,让我们探索这个 Copilot 工作区以及它如何帮助我们构建和维护 AI 应用程序。

2024-07-26
改善行为科学实验与LLMs和Milvus

技术干货

改善行为科学实验与LLMs和Milvus

探索的重点是发现图片中的什么允许这种转变以及如何寻找它。这就是多维图像嵌入和向量数据库发挥作用的地方。

2024-07-26
CPU是否足够?在新型硬件上运行向量搜索的综述

技术干货

CPU是否足够?在新型硬件上运行向量搜索的综述

在Zilliz组织的2024年非结构化数据聚会上,Smile Identity的计算机视觉专家以及NeurIPS BigANN挑战赛的组织者(2021年,2023年)George Williams,探讨了CPU是否足以应对向量搜索/近似最近邻(ANN)。他探索了新的硬件解决方案如何能彻底改变向量搜索,强调了先进的搜索算法与尖端硬件的交汇,并对未来的数据检索技术提供了洞见。

2024-07-26