文章目录
- 1、过拟合
- 2、欠拟合
- 3、图像表现
- 4、解决办法
1、过拟合
过拟合(OverFititing):太过贴近于训练数据的特征了,在对应训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平。
讲一个故事来解释一下过拟合:
假如你在古代当官,你已经摸透了皇上的脾气,知道他讨厌别人文化比自己高,于是你每次写诗都写的很烂,皇上很中意你。
结果后来皇上gg了,太子登基,太子喜欢博学之士,但你还是像以前一样写些很烂的诗,于是你被罢官了,这就是过拟合。
过拟合就是在一个训练集上学得太好了,不管是通用技巧还是特殊情况全都学下来了,换了一个数据及后,那些学到的特殊情况就没用了。
2、欠拟合
欠拟合(UnderFitting):样本不够或者算法不精确,测试样本特性没有学到,不具泛化性,拿到新样本后没有办法去准确的判断。
还是讲一个故事来解释一下:
假如你在古代当官,你没有摸透皇上的脾气,皇帝很讨厌你,卒。
这就是欠拟合。
3、图像表现
4、解决办法
解决过拟合的方法:
降低数据量,正则化(L1,L2),Dropout(把其中的一些神经元去掉只用部分神经元去构建神经网络)
解决欠拟合的方法:增加训练数据,优化算法