海康机器人visionmaster深度学习图像分类-VM4.0.0 - 知乎

一:硬件环境:

深度学习模块训练运算量较大,依赖GPU进行加速,硬件需独立显卡支撑,目前训练只支持英伟达 核心显卡。显卡硬件配置越高,训练及预测耗时越短。

1,模型训练:

 本地训练 a) 6G及以上显存 DL单字符识别训练实现显存自适应,能根据硬件配置自动分配训练 显存,从耗时等综合因素考虑推荐采用6G及以上显存显卡训练,如GTX 1660Super,RTX 2080,RTX 3070等 b) 需去英伟达显卡驱动官网(https://www.nvidia.cn/geforce/drivers/),根 据电脑显卡型号下载451.22版本以上驱动 c) VisionTrain1.4(VM4.0)版本已支持30系列显卡训练(预测),以前版本不支持

 支持萤石云服务器训练

 支持本地云服务器训练 2,模型检测:

 支持GPU版本检测 (需2G及以上显存。单DL模块2G显存可以满足,多DL流程或单流程 多 DL模块需更大的显存)

 支持CPU版本检测 (效果与GPU版本一致,检测耗时会比GPU版本长)

 操作系统要求为Windows7或Windows10 (系统需要安装完整版,不能装裁切版)

若显卡配置符合条件,发现无法进行训练或预测,则需检查显卡驱动,要求安装451.22版本以上显 卡驱动(显卡驱动的要求和显卡本身以及VM的版本有关)

二:适用场景:

深度学习图像分类,通过学习每个目标类别的图像特征,以准确区分各个目标的种类。它利 用计算机对图像进行定量分析,把图像或图像中的每个像元或区域归为若干个类别中的其中一类, 以代替人的视觉判读,在物体识别、分拣方面有广泛应用。 深度学习图像分类时,要求目标物体在 全局视野中的占比越大越好,可通过相机开窗增大目标物体的占比。若物体种类较多,且后续会增 加新的目标类别,则推荐使用深度学习图像检索。

应用价值:实现图片的分类、分级以及浅层的缺陷检测等应用。

三:DL 图像分类训练和测试

一)深度学习图像分类-模型训练:

(1)打开VisionTrain1.4.0训练工具。

(2)PC端:选择目标平台->VM平台(VM平台训练的模型用于VM4.0.0 软件,SC平台训练的模型 用于SC系列智能相机),选择训练类型->图像分类,点击下一步。

(3)点击新建训练集,创建或选择训练样本,训练样本的绝对路径应当不包含空格

(·注:将样本图片放在一个文件夹中,便于后期增加样本以丰富训练集,训练集图片数量 不能少于11张。)。

其中标定保存是在标定过程中,保存标定文件,建议经常性使用。而预标定通常是模型已 经生成,在加入新样本的时,通过先前的模型预测样本标签,提升打标的速度。

(4)图像分类支持批量标注方式,可将已分类在不同文件夹中的样本进行批量标定标签, 不同种类的样本数量尽量保证一致,标定图最少为11张,否则无法点击下一步进行训练。

·注:按步骤3的方式整理训练集图片,可便于后期增加训练样本,训练集的图片数量需

保证每类都有 10~20 张, 类型越多,每个类别所需的样本量越多。另外每张样本应具有 代表性,尽可能包含各种类型的特征。

(5)模型配置训练参数和训练。

 迭代轮次:算法内部称为Epoch,一轮就是将所有训练样本训练一次的过程。增大迭代伦 次可以增加训练的迭代次数。参数根据图片数量设置。30张设置700轮。100张设置500

轮。500张设置200轮。1000张设置150轮。5000张设置100轮。10000张设置60轮。

100000张设置50轮。若训练过程中曲线任有明显的下降趋势,可以暂停训练增大迭代伦 次。

 基础学习率:更新参数时前进的步长。一般就按默认值1设置,不需改动。

 Patch大小:训练过程中,输入神经网络的图像尺寸。有大中小可供选择,对应的缩放分辨 率为488,416,224。Patch为大时,输入网络的图片分辨率较大,因此处理精细程度的能 力越大。当分类物体占图像面积较大时,可以选择小,在保证效果的同时还可以提高训练效 率。为了保证效果建议选择大Patch。

 模型能力:处理复杂图片的能力,有普通和高精度两种模式选择。普通训练、检测速度更快,消 耗的显存资源更小。高精度检测效果更加精确,但资源消耗大。为了保证效果建议选择高精度。

 版本:目前提供VM320、VM330、VM340、VM400四个版本模型训练。VM340版本模型能在

VM3.4及更高的VM版本如VM4.0上使用,VM400版本模型只能在VM4.0及更高的VM版本使用。

 是否剪纸枝:开启剪枝使能后,能设置剪枝比例。根据设置的比例减小模型大小,缩短检测耗 时,同时也会损失一定的检测精度与增加训练耗时。若节拍满足不建议开启。

 是否增强:开启增强使能后,可设置数据增强参数。可进行HSV空间变换、镜像、画布扩大、 裁剪、仿射变换、噪声这六类数据增强的操作。具体设置见“数据增强白皮书”。

模型默认保存路径:VisionTrain1.4.0\Applications\DeepLearningModel里,建议 修改模型生成路径 。

(6)训练过程:

参数设置完成后点击开始训练。 6.1 本地训练过程

依赖本地电脑显卡进行训练,若在测试中发现会出现误识别、漏识别与多识别的情况,可以尝 试增加训练样本或增大迭代轮次。

选择好模型生成的路径(否则会生成在默认位置)与模型名称后点击开始训练,待训练结束后, 会设定好的路径下生成一个.bin 的训练模型。训练结束后点击右下角的结束训练。

6.2 云服务器训练过程

暂不支持VM4.0.0版本的云服务训练,需切换为VM3.4.0。参数设置完成后点击开始训练, 会显示“训练集上传中”,在桌面生成一个训练集压缩包,上传完成后进行云训练,在提示时间内 完成训练后会在对应位置生成模型。

6.3 本地服务器训练过程

由我司专业人员通过组装性能极强的硬件设备,安装ubuntu16.04系统、GPU训练所需驱动 以及nvidia docker,并部署其他必须组件,帮助客户完成本地服务器的搭建。选择训练类型为 本地服务器训练,训练流程与6.2相同。

二)深度学习图像分类-模型测试:

(1)打开VisionMaster4.0.0,使用深度学习图像分类模块进行模型效果测试,将推 演预测错误的图片统一保存至训练集中,使用VisionTrain1.4.0重新标注之后,重新进 行模型训练,此方法增加了样本容量,也是模型优化最直接有效的方式。

·注:若效果不满足预期,可联系对应销售或技术进行技术指导,优化模型。

在VisionMaster4.0.0中拉出一个图像源模块,点击右下角的 或 将需要测试 图片放入模块中。

(2)模块参数说明

 DL分类G/C:其后缀的G/C代表以GPU或CPU进行预测。

 模型文件路径 :选择之前VisionTrain1.4.0训练生成的模型文件。

 方案存模型:在进行方案保存时是否保存当前加载的模型,默认关闭状态,打开后保存的 方案文件包含了模型。

 前K个类别:可配置按照类别概率得分从高到低一次输出前K(模型训练时所有的类别个数) 个类别值,如下图所示。

四:系统运行过程中继续添加样本的方法

在系统运行过程中,通常训练的模型不能一次到位,适用于所有的场景,需要在运行过程 中不断添加样本,增强模型的鲁棒性。方法是: 1. 之前训练集(包括原图、ImageTrainData.txt和label_map.txt文件)不能删 除,新采集或模型误检的原图样本应放到之前的样本中去。

2.对增加样本后的新训练集做二次标定。之前标定的数据还保存在样本的文件夹中,把 新采集的样本再标定好,重新训练模型。训练参数参考以上说明。


原网址: 访问
创建于: 2024-05-24 09:54:42
目录: default
标签: 无

请先后发表评论
  • 最新评论
  • 总共0条评论