AI学习日记——过拟合

2301_76925430

695人浏览 · 2025-09-16 22:03:25

2301_76925430 · 2025-09-16 22:03:25 发布

目录

1.过拟合&欠拟合

2.解决过拟合问题

（1）获取更多的训练数据

（2）筛选更相关的特征集

（3）使用正则化减少参数值

3.带正则化的损失函数

一、拟合

1.过拟合&欠拟合

过拟合（Overfitting）指模型在训练数据上表现良好，但在测试数据或新数据上表现较差，通常因为模型过于复杂，学习了训练数据中的噪声和细节。对应图3

欠拟合（Underfitting）指模型在训练数据和测试数据上均表现不佳，通常因为模型过于简单，未能捕捉数据中的关键模式。对应图1

2.解决过拟合问题

（1）获取更多的训练数据

（2）筛选更相关的特征集

缺点：可能会丢失一些有效信息

（3）使用正则化减少参数值

定义：通过向损失函数添加惩罚项来限制模型复杂度。它在训练过程中约束模型参数，使其趋向于较小的值，从而提高泛化能力。

如下图，如果我认为x3和x4与结果没有那么强相关，我就把其对应的参数值调低

3.带正则化的损失函数

为了消除某一项特征对结果的影响，我们把对应项的参数 $\omega$ 减小，可以通过在损失函数中加对应特征的正则项来实现【损失函数越小越好】

$\lambda$ ：正则化参数（如同梯度下降法的步长/学习率 $\alpha$ ） $\lambda$ >0
$\lambda$ 过大会欠拟合，过小则会过拟合。

正则项中的1/2m是什么作用？

一是为了和第一项保持特征缩放一致，二是为了在样本数量增加的情况也不会影响 $\lambda$

总结

以上就是今天学习的内容，本文简单介绍了过拟合的概念与解决办法，并展开了一下正则化损失函数的学习

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

cover

AI Agent时代来临：2025年普通人如何把握智能体红利，从小白到专家的成长之路！

cover

AI大模型面试题解析之LangChain&LlamaIndex面试高频考点，含核心概念与实战技巧！

cover

【小白教程】用Neo4j图数据库优化Text2SQL：零基础构建语义关系图谱，提升大模型SQL生成准确率

所有评论(0)

查看更多评论

2301_76925430

已为社区贡献7条内容