← 返回题库
传统算法简单

什么是过拟合?有哪些解决手段?

#过拟合#正则化#泛化能力

题目

请解释什么是过拟合,并列出常见的解决手段。

参考答案

过拟合(Overfitting):模型在训练集上表现很好,但在验证/测试集上表现差——即模型”记住了”训练数据的噪声与细节,而非学到通用规律,泛化能力差。

典型信号:训练损失持续下降,验证损失却开始上升。

成因

  • 模型容量过大(参数过多)
  • 训练数据太少或噪声多
  • 训练轮数过多
  • 特征数量远多于样本数量

解决手段

类别手段说明
数据增加数据更多样本/数据增强,治本之策
数据降噪清洗错误标注与异常值
模型降低复杂度减层/减神经元/减特征
正则L1/L2 正则在损失加权重惩罚,L1 稀疏、L2 平滑
正则Dropout训练时随机失活神经元,强制冗余表征
训练早停(Early Stopping)验证损失上升即停训
训练交叉验证选最优轮次与超参
集成Bagging/集成多模型平均降方差(如随机森林)
数据特征选择剔除冗余特征(Lasso/PCA)

面试易错点:题目常以”下列哪种不属于过拟合解决手段”出现,需注意——数据增强、正则化、Dropout、早停属于;而增大学习率、增加训练轮数、增加模型层数不属于(反而可能加剧)。

出处:机器学习算法工程师面试题集(人人文库《2026 人工智能算法工程师机器学习深度学习面试题》)。

内容来源

整理自机器学习算法工程师面试题集

本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。