Zero-shot learning (ZSL) 是机器学习中的一种方法,允许模型对他们在训练过程中从未遇到过的类进行预测。ZSL不是仅仅依赖于每个类的标记训练数据,而是使用丰富的语义信息 (如属性或描述) 来理解已知类和未知类之间的关系。当涉及到对抗性示例 (故意修改以欺骗模型的输入) 时,零射学习可以通过利用其从已知类的属性进行概括的能力来解决这些挑战。
零射击学习处理对抗性示例的一种方法是通过其固有的对语义信息的关注。通过使用链接到每个类的属性或描述,模型可以更好地理解构成类的有效示例的内容。例如,如果使用 “条纹” 或 “毛茸茸” 等属性训练模型来识别动物,即使提供了看似敌对的修改图像,它仍然可以正确识别狗。通过依赖这些属性,该模型专注于关键特征而不是仅仅关注像素值,从而使其对直接攻击具有一定的弹性。
然而,这并不意味着零射学习不受对抗性例子的影响。对抗性攻击仍然可以操纵语义特征或利用可见和不可见类之间的关系。例如,如果对抗性示例与已知属性具有相似性,但以模型未考虑的方式存在根本不同,则可能导致模型做出错误的预测。因此,虽然ZSL通过其基于属性的理解提供了一个处理对抗示例的框架,但为了保持其在实际应用中的稳健性,必须不断进步和防御不断发展的对抗技术。