当前的人体检测技术,基本都会采用到多尺度滑动窗口法,该方法需要对图像做不同尺度的缩放,然后用固定大小的滑动窗口以等距步长在整幅图像上滑动,并对每一个滑动窗口做人体检测。
因此,这个方法的最大优点就是漏检率极低,因为它会对整幅图像都滑动,不会漏掉任何一个可能会出现人体的位置。但是这种优势,是用巨大的搜索空间和时间消耗换来的,检测效率自然会受到较大的影响。这个方法的大致原理,可用下面的流程图演示。
我们以大小为480*640的图像为例,缩放尺度为1.1,首先构建图片中最左侧的金字塔(构建金字塔的结束条件是最顶层图像长小于128或者宽小于64),然后以64*128的滑动窗口,滑动步长为8像素,对每一层都会进行滑动,获得检测窗口。这个时候,我们会获得13473张待检测图像,首先这个数量是很庞大的,其次就是图像冗余很大。
所以针对滑动窗口法的这一弱势,我们有必要对该方法进行改进~
时间: 2024-10-15 00:57:28