Zero-shot learning (ZSL) 是一种用于机器学习的技术,其中AI模型可以处理尚未明确训练的任务。这对于自然语言查询特别有用,因为它允许模型解释并生成对新问题或命令的响应,而无需在训练期间提供这些特定查询的示例。相反,ZSL依赖于理解已知概念之间的关系,并利用这种理解来解决未知概念。
实际上,当模型遇到以前从未见过的自然语言查询时,它会使用其现有的语言结构和含义知识来进行推理。例如,如果要求在各种动物类别上训练的模型识别 “斑马”,则可能不会直接在其训练数据中看到该术语。但是,因为它了解动物的特征以及如何将它们联系起来-例如将斑马识别为类似于马的条纹动物-即使在零射击的情况下,它也可以识别或分类斑马。
开发人员可以通过采用将嵌入功能 (如单词向量) 与语义理解相结合的模型来实现自然语言查询的零快照学习。例如,该模型可以使用来自大型数据集的预训练嵌入,这有助于将新查询与已知类别或任务相关联。如果您要求它将短语翻译成另一种语言或对文本的情绪进行分类,模型通常可以在没有事先特定训练的情况下执行这些任务,这要归功于它能够从以前遇到的相关示例中进行概括。