联邦学习是一种机器学习方法,多个参与方在不共享数据的情况下协作训练模型。联邦学习的主要类型包括水平联邦学习、垂直联邦学习和联邦迁移学习。每种类型都针对参与者数据和使用特征存在差异的不同场景。
水平联邦学习用于参与者的数据共享相同特征空间但分布在不同实体的情况。例如,可以想象几个医院,各自拥有患者记录,但个别患者之间没有重叠。在这种情况下,每个医院在其数据集上训练本地模型,仅共享模型更新,如梯度,而不暴露敏感数据。中央服务器聚合这些更新,以改善全局模型,同时保持隐私。
另一方面,垂直联邦学习发生在不同方拥有相同实体的不同特征时。例如,某银行和某零售商都希望基于相同客户构建模型,但拥有不同的信息——如银行的交易行为和零售商的购买行为。通过垂直联邦学习,模型可以共享和学习特征贡献,而不揭示原始数据点。最后,联邦迁移学习在一方拥有大量标记数据而其他方标记数据有限或没有时提供帮助。这种方法允许参与者利用更大数据集的知识来改善他们的模型,提升整体性能。