CV岗位面试题输入图片尺寸不匹配CNN网络input时候的解决方式。三种以上

admin 2024-09-27 13:07:51 0

扫一扫用手机浏览

文章目录 [+]


文 | 七月在线 编 | 小七

解析:

CV岗位面试题输入图片尺寸不匹配CNN网络input时候的解决方式。三种以上
(图片来源网络,侵删)

1. two-fixed办法:直接对输入图片Resize缩放;
2. one-fixed办法: 固定一边,缩放另一条边;
3. free办法:去失落FC全衔接层参加全局池化层,或者使用卷积层替换全衔接层;

收集之以是要输入固定年夜小的图片,主要是由于收集中存在FC全衔接层,并且全衔接层的一个毛病是参数目年夜容易导致过拟合,关于这部门解释阐明可以参考第9题“假如末了一个卷积层和第一个全衔接层参数目太年夜怎么办?”

卷积层替换全衔接层
在经典分类收集,好比LeNet、AlexNet中,在前面的卷积层提取特性之后都串联全衔接层来做分类。今朝许多收集好比YOLO系列、SSD以及Faster RCNN的RPN,MTCNN中的PNet等都使用卷积层来取代全衔接层,一样可以做到目的分类的后果,并且具有以下长处:
1. 更机动,不必要限制输入图像的分辩率;

2. 更高效,只必要做一次前向计算;
全衔接层和卷积层只要设置好了对应的参数,可以在到达雷同输入输出的后果,在这个意义上,在数学上可以以为它们是可以互相替换的。
将全衔接操作转化成卷积操作,也便是卷积末了一层的feature map 假如使用卷积操作是将每个神经元 Flatten之后dense衔接到后面的多少神经元,以AlexNet为例,末了一层为256x7x7,获得后面的4096个神经元,然则假如使用7X7的卷积查对前面的FeatureMap进行继续卷积(padding=0),不也可以获得 4096X1X1的向量吗,假如图片年夜一些,例如384x384,那没AlexNet末了一层的年夜小便是256X12X12颠末一个7x7的卷积核之后便是4096x6x6了,这时刻这6x6=36个神经元就有了地位信息。如下图所示:


卷积替代全衔接的长处:

1. 对输入分辩率的限定

假如收集后面有全衔接层,而全衔接层的输着迷经元个数便是固定的,那么反推上层卷积层的输出是固定的,继续反推可知输入收集的图片的分辩率是固定的。例如,LetNet因为由全衔接层,输入就只能是28 x 28的。

假如收集中的全衔接层都用卷积层替代,收集中只有卷积层,那么收集的输出分辩率是跟着输入图片的分辩率而来的,输出图中每一个像素点都对应着输入图片的一个区域(可以用stride,pooling来反算)。
2. 计算效力比拟

同样以LeNet来做例子,假如一个图片是280 x 280的分辩率,为了辨认图片中所有的数字(为了简单,假设每个数字都是在这个年夜图划分为10 x 10的网格中),那么为了辨认这100个地位数字,那么至少必要做100次前向;而全卷积收集的特色就在于输入和输出都是二维的图像,而且输入和输出具有相对应的空间布局,我们可以将收集的输出看作是一张heat-map,用热度来代表待检测的原图地位呈现目的的概率,只做一次前向就可以获得所有地位的分类概率。

相关文章

清苑新能源车,引领绿色出行新潮流

随着全球气候变化和能源危机的日益严峻,绿色出行已成为全球共识。作为我国新能源产业的佼佼者,清苑新能源车凭借其卓越的性能和环保理念,...

家电资讯 2024-12-29 阅读3 评论0