1. 过拟合概念
在深度学习或机器学习过程中,在训练集上表现过于优越,在验证集及测试集中表现不佳,模型泛化能力差。
过拟合及常见处理办法整理
2. 常见原因
原因主要是数据样本少及噪声多
- 数据样本少
- 数据噪声多
- 模型复杂度高
- 迭代次数多
3. 解决方法
- 获取更多的数据
- 数据源获取更多的数据
- 数据增强
- 更改模型结构
- 换简单模型
- L1 & L2 范式
- Dropout
- Early Stopping
4. 数据增强
自然语言处理技术中常用的数据增强方法
- 同义词替换
- 随机插入
- 随机交换
- 随机删除
5. L1 & L2 范式
- 范式定义
- 加入范式的目标函数
- L1范式惩罚因子
- L2范式惩罚因子
- 结论
L1 正则化用作特征选择,L2 正则化用作防止过拟合
参考介绍—-机器学习中的正则化
6. Dropout
思想:以指数级别创建不同的网络结果,然后各个网络结果加权平均,解决过拟合
训练阶段,对每一个神经元的输出以keep_prob保留,1-keep_prob置为0;
预测阶段,对每一个神经元的输出乘以keep_prob。
缺点: 训练时间变长2-3倍。
参考介绍—-深度学习中Dropout原理解析