样本内预测和样本外预测是评估预测模型性能时使用的两种方法。样本内预测涉及使用模型训练集中包含的历史数据。在这里,模型直接拟合此数据,并且可以在同一数据集上评估其预测。这使开发人员可以根据已知信息来衡量模型预测结果的准确性。但是,这种方法可能无法提供模型性能的实际度量,因为它之前已经 “看到” 了数据。
另一方面,样本外预测是指根据模型训练过程中未使用的数据预测结果。这通常涉及将数据分成训练集和测试集。一种常见的做法是在一部分数据 (训练集) 上训练模型,然后在其余数据 (测试集) 上评估其性能。这种方法可以更好地指示模型在遇到新的,看不见的数据的真实场景中的表现。例如,如果你建立一个模型来预测股票价格,你会根据过去十年的历史价格对其进行训练,然后根据下一年的数据对其进行评估。
总之,关键区别在于用于评估的数据。样本内预测在训练的相同数据上测试模型,这可能无法可靠地反映其预测能力。相比之下,样本外预测使用单独的数据来评估模型如何推广到新情况。对于有效的模型评估,主要依靠样本外数据至关重要,因为它可以更紧密地模拟实际应用,并有助于识别潜在的过度拟合问题。