博客
加速向量搜索丨排名模型：它们是什么，什么时候使用它们？

加速向量搜索丨排名模型：它们是什么，什么时候使用它们？

2024-07-241 分钟阅读

当您在搜索栏中输入查询时，浏览器会显示相关的结果。这是通过对模型进行排序而实现的，这些模型由复杂的算法和机器学习（ML）驱动。这些模型考虑诸如关键字相关性、文档近因性和用户行为等因素，以便在页面顶部列出最相关的搜索结果。

在更复杂的模型出现之前，搜索算法依赖于布尔逻辑来根据用户定义的条件对结果进行排序。虽然这些模型有时会产生过于具体或广泛的结果，但它们的适应性受到了限制。

为了减轻布尔模型的挑战，向量空间模型引入了相关性的概念。这些模型通过计算搜索查询和文档向量之间的相似性来识别相关的文档。概率模型进一步计算文档与用户搜索查询相关的可能性。

有了ML，高级搜索模型就彻底改变了搜索排名。人工智能（AI）驱动的搜索使用复杂的参数，如用户意图、点击率和用户交互，来对结果页面上的文档进行排序。

本文介绍了不同的排名算法、它们的功能、缺陷、最适合的案例和成功的故事。

展开排名模型

排名模型在大量信息中筛选，以根据搜索查询找到最相关的文档。这项任务特别具有挑战性，因为现代数据库包含了数十亿个必须被扫描的文档。复杂的技术，如查询分析、相似性计算和相关性评分，对于识别高度相关的结果至关重要。与早期不同的是，现代排名模型处理如此大量的数据，在更短的时间内执行所有这些任务，并产生准确的结果。

一个典型的排名模型通过以下步骤来查找与用户搜索查询类似的文档：

查询分析：该模型分析一个搜索查询，提取关键字，并理解用户的意图。
关键字匹配：然后模型扫描数据库并识别包含类似关键字的文档。
特征提取：该模型在搜索查询和文档中都进行特征提取，包括内容质量、关键字频率和用户意图等因素。
文档排序：然后，该模型对提取的特征应用排序算法，以度量文档与搜索查询的相关性。

排名模型已经从简单的计算发展到使用机器学习和深度学习根据用户需求查找文档并进行排序的高精度模型。这些模型可分为以下几种类型：

1.早期启发式模型

这些都是依赖于简单计算和逻辑的基本模型。早期流行的算法，如布尔排序模型和向量空间模型，就属于这一类。其独特的特点是：

使用简单的运算符（AND、OR、NOT）或距离度量来识别相关的文档。
它会产生过于具体的结果，并难以处理复杂的查询。

布尔模型适用于小的文档集合，用户可以用特定的关键字来表达他们的搜索意图。同时，向量空间搜索模型仍然与神经网络一起用于信息检索系统、文档聚类和相似性分析。

2.概率模型

这些模型估计了文档与搜索查询的相关性的可能性。该算法从输入查询和数据库文档中提取不同的特征，包括关键字频率和文档的内容，并使用这些特征来计算两者之间的相关性。

概率模型的独特特征包括：

计算识别类似文档的概率。
与早期的方法相比，提供了对文档相关性的微妙的识别。
有时可能不准确，需要大量的训练数据。

概率模型仍然被用于基于ml的搜索算法中，证明了它们在现代世界中的相关性。通用搜索、文档排名、可信度评分和垃圾邮件过滤是概率排序模型的一些常见应用。

3.机器学习和深度学习排序算法

这些模型在现代很流行，它们通过大量的数据进行训练来学习和提高它们的排名能力。ML模型和DL模型采用两种方法来实现，即向量空间模型和学习排序（LTR）。向量空间模型利用嵌入和距离度量来计算查询和文档之间的相似性。

LTRs是一种学习预测查询与文档的直接相关性的ML模型。

现代深度学习模型也具有上下文感知能力，允许它们通过分析周围的术语来处理模糊的查询。例如，如果你搜索“苹果”，该模型会分析周围的术语，以确定你指的是苹果品牌还是水果苹果品牌。

ML在搜索算法中的独特特征包括：

提供高度准确的结果，并继续改进。
考虑诸如用户意图、印象和点击率等功能。
使用神经网络来理解搜索查询中的隐藏上下文。

机器学习和深度学习排名算法通过不断发展和适应用户需求和不断变化的环境，为增强用户体验提供了无限的机会。搜索引擎、推荐系统、垃圾邮件过滤器和视觉搜索都是这些算法的一些应用。

战略部署：在何时何地使用排名模型

排名模型今天在各种应用程序中被使用。每当需要基于搜索查询显示相关数据时，排序模型就很适合执行此任务。让我们来探讨排序模型的一些常见应用。

数字图书馆数字图书馆是一种文件或物品的集合。在搜索过程中，库会对集合中筛选以找到与搜索查询中类似的对象。搜索词、用户历史记录和偏好以及用户意图等因素有助于排名模型识别数字库中的类似对象。
在线市场排名模型是在线市场提供的无缝体验的英雄。从产品列表到推荐和个性化的主页，排名算法会根据用户的偏好定制结果。在线市场排名算法会评估关键字、用户意图、购买历史、价格和列表质量等因素，以便在用户搜索查询时识别和获取相关产品。
在线市场、新闻平台、流媒体应用程序和社交媒体都可以根据用户的喜好进行个性化的用户订阅。排名模型会考虑用户历史、搜索意图和浏览器历史，以在用户提要中显示最相关的内容。
搜索引擎搜索引擎根据网页与用户查询的相关性，对结果页面上的网页进行排名。用户意图、关键字相关性和频率、内部和外部链接、网页的流行程度以及领域权威在识别类似的结果方面起着重要的作用。这些因素有助于网站在搜索页面上的排名，并在他们的利基市场上建立权威。

选择排名模型

选择正确的排名模型取决于各种因素。在分析项目需求和期望结果之前采用排名模型会导致排名应用程序效率低下。选择正确的模型的一些重要因素是：

不同的排名模型适用于不同的数据格式。像概率模型这样的简单模型可以很好地处理结构化数据，即具有定义良好的属性的数据。对于非结构化和复杂的数据，如网页或音频文件，机器学习或深度学习排名模型是合适的。
具有可用于分析的明确用户参与度指标的应用程序可以使用这些指标来个性化用户体验。显式指标是可量化的指标，包括用户反馈数据、点击、评级、下载、所花费的时间等。在没有显式指标可用的应用程序中，诸如用户交互和点击率等隐式指标会影响排名结果。
具有大量用户的应用程序，如搜索引擎或社交媒体网站，需要具有更快的处理时间和准确输出的模型。在适合离线数据分析的应用程序中，较慢但复杂的排名模型可以很好地完成工作。
虽然排序算法使用户能够搜索相关结果并进行排序，但仍然需要领域的专业知识来开发有效的模型。模型的透明度和公平性在令人满意的用户体验中也起着重要的作用。

实施排名模型：最佳实践

有三种方法：点态排名、成对排名和列表排序。无论采用什么方法，排序模型的实现都要经过一个定义良好的过程。在搜索基础设施中，排序模型的实现包括以下步骤：

数据准备工作从收集相关数据开始，如用户交互和点击率。一旦收集到数据，模型就会扫描其错误，如缺失的值、不一致的值或异常值。数据准备阶段包括检测和纠正这些错误。
特征提取一旦数据准备好，该模型将提取便于进一步处理的有用特征，即关键字频率、内容类型和用户交互度量。这个阶段有时还涉及通过操作现有特性来创建新特性，也称为特性工程。
模型选择和训练下一步是根据影响模型性能的因素，包括数据格式、用户参与度指标和计算约束，选择一个适当的排序算法。一旦选择了一个模型，就会对预处理数据进行训练，以识别数据模式。训练阶段使排序算法能够根据用户的查询进行预测并产生相关的结果。

4.性能评估模型在训练数据上进行训练后，对其进行评估，以评估其对看不见的数据的性能。评估指标，如平均平均精度（MAP）、贴现累积增益（DCG）、精度和召回率，被用来衡量排名模型的准确性。评估指标的输出通过调整模型参数甚至训练另一个排名算法来指导模型开发人员进行模型优化。

5.实施排名模型所面临的挑战：虽然排序算法的实现过程很简单，但它可能会遇到一些障碍。如果及时有效地处理，这些障碍不会影响模型的性能。然而，忽视它们会导致不相关的结果。在排序算法的实现过程中，存在的一些常见障碍包括：

数据稀疏性

新的或利基排名的应用程序通常需要处理有限的数据。有限的数据使模型在训练阶段无法识别有效的模式。解决方案：数据增强技术可以减轻数据稀疏性的挑战。这些技术包括通过操作现有的训练数据来创建合成数据。使用迁移学习，即在类似的利基中预先训练的模型，有助于获得更好的模型性能。

模型可伸缩性

随着排名应用程序的增长，它的数据和操作需求也在增长。处理大量的数据并处理它们以识别类似的对象可能在计算上是可扩展的。计算成本会减慢模型的性能，甚至可能影响其准确性。

解决方案：使用高效的模型架构或分布式计算框架，提高了排序模型的可伸缩性，并提高了搜索精度。

可解释性

深度学习模型通常隐藏着底层逻辑，这使得用户很难解释排名模型如何对相似的对象进行排序，以及为什么一个对象的排名高于另一个对象。这引起了人们对公平性的关注，并使模型调试具有挑战性。

解决方案：实现可解释的人工智能实践，如局部可解释模型不可知解释（LIME）来分解模型的排名逻辑，提高了模型的可解释性。在可能的情况下使用更简单的模型，具有像概率模型这样的内在可解释性，也有助于保持透明度。除了这些技术复杂性之外，领域的专业知识还有助于根据利基需求设计合适的排名算法。定期监测排名模型，以评估其适应性和性能，可以解决潜在的缺陷。

排名模型的评估和增强

用户体验取决于排名模型的性能。为了获得更好的用户体验，需要获得排名模型的最佳性能。有几种指标和技术可以用来衡量排名模型的有效性。以下是其中的一些内容：

精度

精度是一个度量搜索结果与用户查询的相关性的度量标准。它度量有多少检索到的结果实际上与查询相关。例如，精度将分析接收到的前10个结果，并检查有多少结果与查询相关。

召回率

召回率度量排名模型从数据库中检索到的所有相关文档或对象的数量。例如，0.8的召回率表明一个模型检索了80%的相关文档。因此，值接近1表示模型性能良好。

标准化折现累积增益（NDCG）

NDCG是一个排名度量，它将检索到的对象与理想顺序进行排序。例如，如果用户搜索电影，模型将电影搜索结果与理想搜索结果进行比较。NDCG度量取值在0到1之间，1表示准确匹配，较低的值表示匹配不准确。这些值有助于调整模型参数，以优化模型的性能。

度量标准为微调排名模型提供了一个很好的开始，但是先进的技术会导致全面的评估。A/B对不同参数的测试和评估是确保模型评价公平性的两个因素。

一旦测量了模型性能，典型的下一步是对模型性能进行微调。它需要多次迭代才能获得有效的模型性能。改进模型性能的一些关键技术有：

微调参数

多个超参数塑造了排序模型的行为。根据精度指标调整超参数可以提高模型的性能。诸如网格搜索、随机搜索和贝叶斯优化等技术被用于对模型参数进行微调。

特征工程

另一种改进模型性能的方法是通过操作现有的特性来创建新的特性。当某种特征组合提高模型性能或特定特征对模型预测产生负面影响时，这种方法就有效。调整这些特性可以获得更好的性能。

集成技术

集成技术结合了两个或两个以上的ML模型来利用它们的能力。而不是依赖于一个模型，多个模型会导致更好的性能。

反馈回路

反馈循环是将人工智能生成的输出与外部最终用户操作进行比较的过程。外部最终用户操作可能包括用户评级或点击率，以评估对模型的理解。通过提供类似人类的反馈周期，随着时间的推移提高了模型的性能。

培养模型适应性

模型的适应性对于确保排名模型跟上不断发展的搜索景观至关重要。允许排序模型适应新的用户数据和排序实践的技术是确保模型适应性的一种方法。使用主动学习来选择最重要的特性也有助于解决过时的模型。

重点关注卓越的排名模型

某些排序模型能够有效地识别数据库中的相似对象。从高精度到可伸缩性和大量的用例，这些模型被亚马逊、谷歌和Netflix等知名公司使用。这些常用的排名模型包括学习排名算法、基于bert的排序器和神经排名模型。

学习排序（LTR）算法

LTR算法旨在针对用户查询对项目列表进行相关性评分。这些模型是在人工注释或隐式收集的数据上进行训练的。LTR可以处理各种数据格式，通常使用随机梯度下降法进行模型优化。LTR算法有许多最佳拟合的用例，其中一些包括：

搜索引擎
推荐系统
信息检索系统

学习给成功的故事进行排名

当用户在亚马逊搜索中输入关键字时，亚马逊使用LTR算法向用户显示最相关的产品。该算法跟踪关键字相关性、转换率、销售历史、产品图像、印象、可用性、价格、评论和点击率，从而在搜索结果页面上对产品进行排名。

基于BERT的排名者BERT代表来自变形金刚的双向编码器表示。BERT是一个预先训练过的转换器，一个擅长理解自然语言环境的深度学习模型。基于bert的排序者捕获搜索查询的更精细的细节，以产生更准确的结果，并超越关键字匹配。基于bert的评分机的实际应用包括：

搜索引擎
语音搜索
会话接口

基于BERT的排名成功故事

谷歌助手使用一个基于bert的排序器来理解用户查询并产生精确的搜索结果。伯特还在搜索结果中强调了网页上的相关句子或段落。此外，它还允许谷歌助手学习用户的发音和进行自然的对话。

神经排序模型神经排序模型使用神经网络来识别隐藏的模式，并学习数据点之间的联系。这些模型可以处理大量的数据，执行复杂的计算，并提供可伸缩性，以适应不断变化的需求。神经排名模型的实际应用包括：

大型搜索引擎
高度个性化的推荐系统

神经排名模型的成功故事

Netflix使用了一个神经排名模型，为用户提供个性化的电影推荐。Netflix的神经排名模型考虑了用户意图、偏好、观看时间、观看历史和用户个人资料来生成推荐。Netflix个性化服务还为用户提供个性化信息和参与应用程序通知。

选择正确的模型取决于应用程序的需求。这些因素包括项目目标和因素，如计算约束和数据可用性。

在未来的视野中导航

从布尔搜索系统开始，排序模型迄今为止一直经历了创新的转换。这场革命尚未停止，排名模型仍在发展成为更健壮的算法。这些进步通过将用户体验和道德考虑放在最前沿，提供了无限的机会。新兴的排名模型采用了一系列的技术，其中包括：

语义排序排序模型通过使用知识图来捕获对象列表之间的关系，已经超过了现有的算法。知识图使排名模型具有上下文感知能力，从而导致对用户查询的类似人类的理解和准确的排序。像BERT和GPT-3这样的转换器架构也允许排名模型在更深的层次上理解用户的意图。
以用户为中心的个性化使用ML进行上下文，允许企业为用户提供高度个性化的系统。使用XAI技术也很重要，以便用户理解为什么排名模型会产生一定的结果。这增强了用户对人工智能的信任度，并导致了更安全的人工智能实践。

3.诸如语义搜索和以用户为中心的方法等高级技术使高级排名系统的开发成为可能。随着在排名系统中使用自然语言处理（NLP）的兴起，语音和多语言搜索等应用程序都建立在排名模型之上。

4.排名模型在各个领域的兴起引起了用户和一般公众的伦理关注。使用无偏的和相关的数据可以确保排序模型不会产生有区别的结果。此外，实现XAI实践进一步增强了用户的信任度、透明度和清晰度。

24.webp

结论

今天，搜索引擎不仅依赖关键字频率，还依赖用户意图和行为，这彻底改变了搜索排名算法。复杂的人工智能技术和伦理考虑承诺了一条更先进的排名算法的道路，跨不同领域和语言提供高度个性化的排名。

了解更多关于排名算法及其实现，包括最先进的排名算法ListMLE和LambdaRank。测试不同的排名算法，并通过支线项目或开源贡献参与它们的实现，将提供多样化和有价值的经验。

Haziqa Sajid
Freelance Technical Writer

更多推荐

继续阅读

别让错配阶段的 Data Infra，拖垮你的AI项目

从原型到企业级规模，解析 AI 团队如何按阶段选择 data infra，避免过早工程化与后期重构。

观点 | 从 Vector Database 到 Vector Lakebase，如何定义AI data infra的下一个十年

了解 Zilliz Vector Lakebase 如何统一非结构化数据、索引与计算，支撑 RAG、Agent 和批量处理。

加速向量搜索丨排名模型：它们是什么，什么时候使用它们？

继续阅读

别让错配阶段的 Data Infra，拖垮你的AI项目

观点 | 从 Vector Database 到 Vector Lakebase，如何定义AI data infra的下一个十年

LLMs 记忆体全新升级：六大新功能全面出击，用户体验值拉满！

AI Assistant