博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
权重初始化的方法
阅读量:1873 次
发布时间:2019-04-26

本文共 583 字,大约阅读时间需要 1 分钟。

在以往的文章里面,全连接层的权重我是给初始化成0的,但卷积层是初始化成正态分布。其实,权重初始化成0是一件很糟糕的事情。

权重初始化全部为0就会造成网络对称问题,把这个结论推导到卷积层,自然结果也是一样,所以,把权重初始化为0是一件很笨的事情。为了克服这种现象,我们一般选择随机正态分布初始化权重,但是随机正态分布初始化的缺点就是初始化可能权重很小也可能很大。

1.自编码器中的一种参数初始化方法 Xavier initialization,它是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文

如果深度学习模型权重初始化太小,那么信号将在每层间传递是逐渐缩小而难以产生作用,但如果权重初始化太大,那信号将在每层间传递时逐渐放大并导致发散和失效。而Xaiver初始化器就是让权重被初始化得不大不小,正好合适。从数学得角度分析,Xavier就是让权重满足:均值为0,方差为\frac{2}{n_{in}+n_{out}},分布可以用均匀分布或者高斯分布。

如果是均匀分布,分布在(-a,a),那么该均匀分布得均值,方差分别为:

E=\frac{(-a)+(a)}{2}=0,V=\frac{[(-a)-(a)]^2}{12},令E=Xavier的均值,V=Xavier的方差,那么得到a=\sqrt{\frac{6}{n_{in}+n_{out}}}

那么只需要将权重初始化在上述的标准分布里面,就得到了Xavier初始化。注意,其中接受的两个参数是输入的维度和输出的维度。

2.其初始化方式,在pytorch中请查看torch.nn.init.normal_()

转载地址:http://llwbf.baihongyu.com/

你可能感兴趣的文章
485通信自动收发电路,历史上最详细的解释
查看>>
【视觉盛宴三】不好意思,这些线材接口的横截面真的没见过
查看>>
一位头发发白的神人教你怎么写程序,运维,买电脑,写文章,平面设计!
查看>>
【第二期】那些设计漂亮、有创意的电路板!
查看>>
【第三期】那些设计漂亮、有创意的电路板!
查看>>
继续推荐公众号~
查看>>
「第二篇」全国一等奖,经验帖。
查看>>
「第三篇」全国电子设计竞赛,这些你必须知道的比赛细节,文末附上近十年电赛题目下载...
查看>>
5G小科普(漫画版,So easy!)
查看>>
无人再提华强北
查看>>
千万不要小瞧那些不好好写代码的程序员
查看>>
80后,天才程序员, Facebook 第一任 CTO,看看开挂的人生到底有多变态?
查看>>
「第四篇」电赛控制题可以准备一些什么?
查看>>
「第五篇」全国电子设计竞赛-电源题设计方案总结
查看>>
「第六篇」对于电赛,我们应该看重什么?
查看>>
树莓派翻车了
查看>>
垃圾分类背后的数据和真相
查看>>
PID算法搞不懂?看这篇文章就够了。
查看>>
这位电子工程师,你不能错过。
查看>>
十八般武艺教你如何解决问题
查看>>