过拟合和欠拟合
概念:模型不合适,导致其无法对数据实现有效预测。
| 训练数据 | 预测数据 | |
|---|---|---|
| 欠拟合 | 不准确 | 不准确 |
| 过拟合 | 准确 | 不准确 |
| 好模型 | 准确 | 准确 |
如何解决过拟合问题
原因
- 模型结构复杂(维度过高)
- 使用了过多属性,模型训练时包含了干扰项信息
解决办法
- 简化模型结构(使用低阶模型,比如线性模型)
- 数据预处理,保留主成分信息(数据PCA处理)
- 在模型训练时,增加正则化项
工作学习中的点点滴滴。
概念:模型不合适,导致其无法对数据实现有效预测。
| 训练数据 | 预测数据 | |
|---|---|---|
| 欠拟合 | 不准确 | 不准确 |
| 过拟合 | 准确 | 不准确 |
| 好模型 | 准确 | 准确 |