目标干脆面君：动动手，用TensorFlow API训练出自己的目标检测模型

转载时间：2021.08.26（原文发布时间：2017.10.12）

158

转载作者：36氪企服点评小编

阅读次数：158次

编者按：本文来自微信公众号“将门创投”（ID：thejiangmen），来源：Medium，编译：Tom R，36氪经授权发布。

TensorFlow内包含了一个强大的物体检测API，我们可以利用这API来训练自己的数据集实现特殊的目标检测。

Dat Tran就分享了自己实现可爱的浣熊检测器的经历，在文章中作者把检测器的训练流程进行了梳理，我们可以举一反三来训练其他在工作项目中需要的检测器。下面我们一起来学习一下吧！

目标干脆面君：动动手，用TensorFlow API训练出自己的目标检测模型

为什么要做这件事？

方便面君不仅可爱，在国外很普遍的与人们平静地生活在一起。处于对它的喜爱和与浣熊为邻的情况，作者选择了它作为检测器的检测对象。完成后可以将摄像安装在房子周围，检测是否有浣熊闯入了你家，你就能及时知道是否来了不速之客了。看来浣熊还真多啊！

目标干脆面君：动动手，用TensorFlow API训练出自己的目标检测模型

创建数据集

机器学习需要数据作为原料，那么我们首先需要做的就是建立起一个可供训练的数据集，同时我们需要利用符合Tensorflow的数据格式来保持这些数据及其标签：

1. Tensorflow的物体检测接口主要使用TFRecord文件格式，我们需要将数据转换为这个格式；

目标干脆面君：动动手，用TensorFlow API训练出自己的目标检测模型

2.有很多工具可以完成数据的转换，无论是类似PASCAL VOC数据集或是Oxford Pet数据集的格式，都有很多成熟的脚本来完成转换，甚至也可以自己写一个脚本来转换，跟着文档解释不会太难；

3.在准备输入数据之前你需要考虑两件事情：其一，你需要一些浣熊的彩色图片；其二，你需要在图中浣熊的位置框坐标（xmin，ymin，xmax，ymax）来定位浣熊的位置并进行分类。对于只检测一种物体来说我们的任务十分简单，只需要定义一类就可以了；

4.哪里去找数据呢？互联网是最大的资源啦。包括各大搜索引擎的图片搜索和图像网站，寻找一些不同尺度、位姿、光照下的图片。作者找了大概两百张的浣熊图片来训练自己的检测器（数据量有点小，但是来练手还是可以的）;

目标干脆面君：动动手，用TensorFlow API训练出自己的目标检测模型 5.有了数据以后我们需要给他们打标签。分类很简单都是浣熊，但是我们需要手动在每一张图中框出浣熊的位置。一个比较好的打标工具是LabelImg。编译好后只要要在图片上轻点鼠标就可以得到PASCAL VOC格式的XML文件，再利用一个脚本就可以转换成Tensorflow需要的输入格式了；有时候在Mac上打开jpeg图像会出现问题，需要将其转换为png来解决；