读书笔记:实时的物体检测(基于深度学习网络)

序言

小编好久没有写东西,最近还是在想如何解决快速进行图像分割问题,看了一些文章,其中下面这篇文章的 ppt 还是通俗易懂的。


http://pjreddie.com/publications/
You Only Look Once: Unified, Real-Time Object Detection, Joseph Redmon, Santosh Divvala, Ross Girshick, and Ali Farhadi, 2016 CVPR

背景介绍

普通的 R-CNN (Regions with Convolutional Neural Network) 使用Regions建议算法找出一些可能的包围盒,然后用深度学习的识别器去识别这些包围盒。

然后每个包围盒对每个类都产生一个置信度。对这些包围盒整理,去除重复,覆盖等情况,就可以产生一个图像分割(Segmentation)。

但是最大的问题,这样计算量太大了,需要遍历所有包围盒。

YOLO CVPR 2016 的截图

screenshot-from-2017-01-12-10-41-04

一个图可能有2k个提议的区域(region proposals)需要去识别。

YOLO解决方案

首先把图片用网格分割

screenshot-from-2017-01-12-10-57-33

然后对网格里面的每个格子进行识别

screenshot-from-2017-01-12-11-21-46

这里是这篇文章的贡献,一般来说深度学习网络输出是一个图像的,如下图,传统的识别器一个图片输出每个类的可信度。

screenshot-from-2017-01-14-20-09-38

然后这里这篇文章修改了网络,输出一个网格的N×N的每个类置信度,这样大大加速了计算。

screenshot-from-2017-01-14-20-10-44

最后可以产出这个网格图:

screenshot-from-2017-01-14-20-16-27

整体的流程图为以下,利用网格的输出概率预测所有不同的包围盒。

screenshot-from-2017-01-14-21-22-09

最后。。如何产生这些包围盒呢?貌似训练阶段的时候独立训练的,其实就是产生相对位置大小的包围盒。

screenshot-from-2017-01-14-22-07-39

最后识别结果

screen_shot_2016-11-17_at_11-14-54_am

最后速度确实比较快,因为只是识别了一次图片,然后对网格的每个格子作为特征预测包围盒,所以速度很快,当然文章也说了一些缺点,譬如对小物体不合适,还有网格的格子分割小物体等等。。

《读书笔记:实时的物体检测(基于深度学习网络)》有2个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注