--

deeplearning -- object detection 目标检测



这里我们要完成一个任务,在图片中找到汽车,并把它的位置、大小标识出来。

在 Udacity 的 self-driving car engineer 课程当中是利用了一个滑动窗口来进行,用一个 SVM 的分类器。
而当前比较现进的是用 YOLO 或者 SSD 来进行识别,这样会更快。

我们这里也用 YOLO 来处理,框架就用 tensorflow 吧。

一步一步来,我们如何来标识汽车?
可以在上面画个框即可,这个可以用 OpenCV 来做

import cv2
def draw_rectange(img, bboxes, color=(0, 0, 255), thick=6):
    img2 = np.copy(img)
    for bbox in bboxes:
        p1, p2 = bbox
        cv2.rectangle(img2, (p1, p2), color, thick)
    return img2


YOLO:
Redmon et al., 2015. You Only Look Once: Unified, Real-Time Object Detection. [arXiv]

SSD:
W. Liu et al., 2015. SSD: Single Shot MultiBox Detector. [arXiv]

Faster R-CNN
S. Ren et al., 2015. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. [arXiv]