共享内存 shared memory的生命周期是跟随block的生命周期的,即一份shared memory随着block的开启而开启,随着block(里所有thread)的结束而结束。 但从物理上说, shared memory里的数据并没有被清空。 如果一个新的block被分配到了这段share ...
CUDA Shared Memory 共享内存
CUDA里的shared memory是block级别的,所以两件事需要keep in mind:1)当你allocate shared memory的时候,你其实在每个block里面都创建了一份同样大小却互相独立的share memory2)当你进行__syncthreads()操作的时候,你只能 ...
Official YOLOv3 training on VOC 使用VOC数据集训练官方YOLOv3
在之前的文章中,我们已经讲解了YOLOv3的原理。这篇,我们来折腾一下YOLOv3的训练实操。此篇中,我们不打算动手写YOLOv3的算法编程实现,而是直接使用官方代码进行编译,这样我们的折腾点都在数据集配置,调参等方面。 首先进入YOLO的官网https://pjreddie.com/darknet ...
YOLOv3 目标检测算法之YOLOv3
YOLOv3是v2的进一步升级,它的论文在此它的模型借用levio的绘制,如下: YOLOv3的改进主要在于下面两点:1)backbone网络从darknet-19变成了darknet-532)多尺度预测 1)Backbone: Darknet-53从YOLOv2到YOLOv3,backbone从d ...
YOLOv2 目标检测算法之YOLOv2
YOLOv2论文在此 事实上,根据论文来看,作者根据不同的改进提出的是两个模型1)提高YOLO的精度同时保持速度,这是YOLOv22)提出了一种分类和检测的联合训练策略,使得模型更强大,可以检测多达9000个类别,这是YOLO9000 我们先来看YOLOv2对于YOLOv1的改进: YOLOv2改进 ...
SSD 目标检测算法之SSD
论文见此 SSD算法全称为Single Shot MultiBox Detector,它和YOLO一样,是一种one-stage的检测方法,区别于RCNN系列的proposal+predict的two-stage方法。 SSD是基于YOLO进行改进的,它主要改进的地方有三点: 1)多次取各种大小的特 ...
YOLO 目标检测算法之YOLO
论文在此 YOLO这个名字完整体现了算法的精髓:You Only Look Once 它与RCNN系列算法不同。RCNN系列算法(RCNN/Fast RCNN/Faster RCNN)是经过了两次检测,第一次是获取proposal box,第二次才是图像预测。YOLO算法通过回归来完成物体检测,期间 ...
Mask RCNN 用于实例分割的Mask RCNN网络
论文在此 Mask RCNN是在Faster RCNN基础上的改进算法。这里之所以单独成文是因为Mask RCNN不仅仅用于目标检测,还用于实例分割。 目标检测和实例分割的区别在于,实例分割不仅仅需要将目标识别,还需要将它的轮廓绘出。这意味着需要对每一个像素进行分类。 Mask RCNN的改进点先 ...
RCNN Series 用于目标检测的RCNN系列网络
首先我们看我们要实现的什么: 我们要实现图3的Object Detection.不仅需要将物体识别出来还需要画出它们的位置。我们知道将物体识别,通过CNN是可以实现的,那么这里关键的部分就是定位了。基于CNN和定位的思想,算法界出现了RCNN,即Region Convolution Neural ...
Face Recognition by SVM or PCA 基于SVM或PCA的人脸识别
本文将分别讲述基于SVM和PCA的人脸识别 SVM人脸识别理论在之前的文章中,我们讲过SVM的原理:利用超平面进行二分类。我们来看看它是怎么作用到人脸识别上来的。 人脸作为一张h*w的二维图像(去掉颜色通道的灰度图),可以看做一个h*w维的(含有h*w个坐标值)的数据。在SVM里,寻找到一个h*w- ...