过拟合和欠拟合

概念:模型不合适,导致其无法对数据实现有效预测。

训练数据 预测数据
欠拟合 不准确 不准确
过拟合 准确 不准确
好模型 准确 准确

如何解决过拟合问题

原因

  • 模型结构复杂(维度过高)
  • 使用了过多属性,模型训练时包含了干扰项信息

解决办法

  • 简化模型结构(使用低阶模型,比如线性模型)
  • 数据预处理,保留主成分信息(数据PCA处理)
  • 在模型训练时,增加正则化项