个人认为 BN 不能解决过拟合,根据 paper 中的实验来说,是无法阻止过拟合的。但是 BN 可以在某些情况下对过拟合有抑制作用,使得过拟合在更多的 train epoch 之后才出现。不能解决但是能缓解。
BN 的核心思想不是为了防止梯度消失或者是防止过拟合,其核心思想是通过系统参数搜索空间进行约束来增加系统鲁棒性,这种约束压缩了搜索空间,约束也改善了系统的结构合理性,这会带来一些列的性能改善,比如加速收敛、保证梯度、缓解过拟合等等。
原创 | 2022-11-18 10:44:12 |浏览:1.6万
个人认为 BN 不能解决过拟合,根据 paper 中的实验来说,是无法阻止过拟合的。但是 BN 可以在某些情况下对过拟合有抑制作用,使得过拟合在更多的 train epoch 之后才出现。不能解决但是能缓解。
BN 的核心思想不是为了防止梯度消失或者是防止过拟合,其核心思想是通过系统参数搜索空间进行约束来增加系统鲁棒性,这种约束压缩了搜索空间,约束也改善了系统的结构合理性,这会带来一些列的性能改善,比如加速收敛、保证梯度、缓解过拟合等等。
Copyright 2005-2020 www.kxting.com 版权所有 | 湘ICP备2023022655号
声明: 本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:47085,1089@qq.com