如何防止我的模型过拟合?这篇文章给出了6大必备方法
发布时间:2021-1-30 21:14阅读:259
在机器学习中,如果模型过于专注于特定的训练数据而错过了要点,那么该模型就被认为是过拟合。该模型提供的答案和正确答案相距甚远,即准确率降低。这类模型将无关数据中的噪声视为信号,对准确率造成负面影响。即使模型经过很好地训练使损失很小,也无济于事,它在新数据上的性能仍然很差。欠拟合是指模型未捕获数据的逻辑。因此,欠拟合模型具备较低的准确率和较高的损失。
图片
如何确定模型是否过拟合?
构建模型时,数据会被分为 3 类:训练集、验证集和测试集。训练数据用来训练模型;验证集用于在每一步测试构建的模型;测试集用于最后评估模型。通常数据以 80:10:10 或 70:20:10 的比率分配。
在构建模型的过程中,在每个 epoch 中使用验证数据测试当前已构建的模型,得到模型的损失和准确率,以及每个 epoch 的验证损失和验证准确率。模型构建完成后,使用测试数据对模型进行测试并得到准确率。如果准确率和验证准确率存在较大的差异,则说明该模型是过拟合的。
如果验证集和测试集的损失都很高,那么就说明该模型是欠拟合的。
如何防止过拟合
交叉验证
交叉验证是防止过拟合的好方法。在交叉验证中,我们生成多个训练测试划分(splits)并调整模型。K-折验证是一种标准的交叉验证方法,即将数据分成 k 个子集,用其中一个子集进行验证,其他子集用于训练算法。
交叉验证允许调整超参数,性能是所有值的平均值。该方法计算成本较高,但不会浪费太多数据。交叉验证过程参见下图:
图片
用更多数据进行训练
用更多相关数据训练模型有助于更好地识别信号,避免将噪声作为信号。数据增强是增加训练数据的一种方式,可以通过翻转(flipping)、平移(translation)、旋转(rotation)、缩放(scaling)、更改亮度(changing brightness)等方法来实现。
移除特征
移除特征能够降低模型的复杂性,并且在一定程度上避免噪声,使模型更高效。为了降低复杂度,我们可以移除层或减少神经元数量,使网络变小。
早停
对模型进行迭代训练时,我们可以度量每次迭代的性能。当验证损失开始增加时,我们应该停止训练模型,这样就能阻止过拟合。
下图展示了停止训练模型的时机:
图片
正则化
正则化可用于降低模型的复杂性。这是通过惩罚损失函数完成的,可通过 L1 和 L2 两种方式完成,数学方程式如下:
图片
L1 惩罚的目的是优化权重绝对值的总和。它生成一个简单且可解释的模型,且对于异常值是鲁棒的。
L2 惩罚权重值的平方和。该模型能够学习复杂的数据模式,但对于异常值不具备鲁棒性。
这两种正则化方法都有助于解决过拟合问题,读者可以根据需要选择使用。
Dropout
Dropout 是一种正则化方法,用于随机禁用神经网络单元。它可以在任何隐藏层或输入层上实现,但不能在输出层上实现。该方法可以免除对其他神经元的依赖,进而使网络学习独立的相关性。该方法能够降低网络的密度,如下图所示:
图片
总结
过拟合是一个需要解决的问题,因为它会让我们无法有效地使用现有数据。有时我们也可以在构建模型之前,预估到会出现过拟合的情况。通过查看数据、收集数据的方式、采样方式,错误的假设,错误表征能够发现过拟合的预兆。为避免这种情况,请在建模之前先检查数据。但有时在预处理过程中无法检测到过拟合,而是在构建模型后才能检测出来。我们可以使用上述方法解决过拟合问题。
温馨提示:投资有风险,选择需谨慎。
版权及免责声明:本文内容由入驻叩富问财的作者自发贡献,该文观点仅代表作者本人,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至kf@cofool.com 举报,一经查实,本站将立刻删除。
推荐相关阅读
查看更多>
如何进行开户?看完这篇文章就明白了!
你好,很高兴回答你的问题,证券开户是指投资者在证券公司开设证券交易账户的过程,以便能够进行股票、债券、基金等证券交易的过程,下面为你具体介绍一下开户流程:如何进行开户流程如下: 1、首先,...
怎么开户佣金是最低的?看完这篇文章你就知道了
您好,开户佣金没有最低一说,一般在万三左右,目前没有绝对佣金最低的证券公司,像中信证券、华泰证券、国泰海通证券等头部券商,通过正规渠道都有机会申请到较低佣金。想要开通低佣金账户,关键在于选对开户...
什么是基金以及基金有哪些特点,这篇文章告诉你
投资者你好,基金就是一群投资者把钱集中起来,交给专业的基金管理团队去投资,比如买股票、债券等,目的是为了赚取更多的钱,而投资者则根据投入的比例分享收益。基金作为一种集合投资工具,具备以下特点:1...
期货量化软件怎么选?这篇文章告诉你
您好,看到你在找期货量化软件的选择指南了吧?选对软件确实能让你的交易事半功倍。不过市面上那么多选择,确实容易让人挑花眼。让我来帮你梳理一下,看看怎么选最适合你的那一款。选择期货量化软件时,您需要...
请问用车办贷款需要大本吗?这篇文章告诉你
用车办贷款通常需要车辆的大本(即机动车登记证书)。这是因为大本是车辆所有权的法律凭证,贷款机构需要通过抵押大本来确保贷款的安全性。具体流程如下:提交申请:向贷款机构提交贷款申请及相关材料,如身份证、收入证明、车辆大本等。车辆评估:贷款机构会对车辆进行评估,确定其价值。签订合同:评估通过后,签订贷款合同,明确贷款金额、利率、期限等。抵押登记:贷款机构会到车管所办理抵押登记手续,抵押期间大本由贷款机构保管。放款:手续完成后,贷款机构会发放贷款。注意事项:选择正规机构:避免高利贷或诈骗...
看完这篇文章,你就懂得如何选择贷款平台了
当寻找适合自己的贷款平台时,应当全面考虑以下几个关键因素,以确保选择到既安全又高效的服务:下面是这些挑选平台的参考方法:一、平台资质与可靠性背景金融许可:首要确认平台是否持有由金融监管机构颁发的正规金融牌照,如小额贷款或消费金融牌照,这是其合法性和安全性的基石。可以通过官方渠道核实平台的资质信息。企业背景:深入了解平台的公司背景,倾向于选择有知名互联网巨头或金融机构支持的平台,这类平台通常拥有更强的资本实力和风控能力,服务更加稳健。二、产品特性与借款要求借款范围与期限...
TA的文章
全部>
TA的回答
全部>
优选券商
更多>
热点推荐
-
中信证券现在可以买黄金吗?有人知道吗?
2025-11-03 09:31
-
北交所怎么开户?如何开通北交所交易权限?
2025-11-03 09:31
-
一文搞懂一条产业链——【通信设备及服务】
2025-11-03 09:31


当前我在线

分享该文章
