参考博文:
1.感受野的计算
计算机视觉中常常出现感受野的概念,我是在修改SSD网络中的过程中,发现增强感受野是非常有必要的。SSD的主干网络是VGG16,其中有个结论:低层特征图的感受野较小,高层特征图的感受野较大。
感受野定义
神经网络中每一层输出特征图上的像素点在输入图片上的映射的区域大小,也就是特征图上的每一个点对应的输入图片的区域。
计算公式
示例
在VGG16中:pool5中
pool5:RF=2
conv5_3 :RF=(2-1)1+3=4
conv5_2 : RF=(4-1)1+3=6
conv5_2: RF=(6-1)1+3=8
conv5_1: RF=(8-1)2+2=16
pool4 : RF=(8-1)2+2=16
conv4_3: RF=(16-1)1+3=18
conv4_2: RF=(18-1)1+3=20
conv4_1 : RF=(20-1)1+3=22
pool3: RF=(22-1)2+2=44
conv3_3: RF=(44-1)1+3=46
conv3_2: RF=(46-1)1+3=48
conv3_1: RF=(48-1)1+3=50
pool2: RF=(50-1)2+2=100
conv2_2: RF=(150-1)1+3=152
conv2_1: RF=(152-1)1+3=154
pool1: RF=(154-1)2+2=208
conv1_2: RF=(208-1)1+3=210
conv1_1: RF=(210-1)1+3=212
计算结果为:pool5输出的特征图在输入图片上的感受野为212*
结果如下图所示: