机器视觉基础知识 Fundamentals of Machine Vision（图像处理） - 知乎 - 程序猿·D·安宇雨 DeepMind

机器视觉基础知识 Fundamentals of Machine Vision（图像处理） - 知乎

安宇雨 - 随手采集
2024-03-01 10:49:15
随手采集
0000-未整理-等待研究

版权声明： 本翻译文章为原文《Fundamentals of Machine Vision》原始来源：https://www.autovis.com/images/pdf/resources/fundamentals-of-machine-vision.pdf（作者：Peppy West - AUTOMATED VISION SYSTEMS, INC. San Jose, California 95124 U.S.A.）。作者和贡献者对原文内容享有版权。请阅读原文以了解详细信息和权限限制。翻译权归本翻译者所有，非商业用途，仅用于学术研究和交流目的。未经授权，不得用于商业目的或其他侵权行为。本翻译保留所有权利。如有引用或使用，请注明原文出处和作者。本翻译文章中的内容仅供参考，可能存在错误或不准确之处，请读者自行核实原文内容。

- *

图像处理

图像处理中的一个重要问题是选择使用算法、工具还是深度学习。首先，让我们来看一下图像处理的过程，实际上它是算法执行图像处理的分类学。

图像处理过程

基本上，图像处理包括四个步骤，从开始的图像获取过程到最后的结果输出过程。这个过程如图30所示，包括以下四个步骤：预处理、分割、特征提取和解释。这个图表有些简化，因为并不是所有应用都需要这四个步骤。有些应用不需要预处理，而有些应用则不需要分割。其中的任何一个步骤可能需要一个或多个算法。通常情况下，会有反馈回路，初步分析根据检测到的图像特征和内容选择特定的步骤序列。

传统算法

预处理

预处理算法以图像作为输入，并生成修改后的图像作为输出。例如，该算法可以滤除噪声（图31），或者提取边缘（图32）。存在大量的预处理操作。非常有经验的图像处理程序员会知道哪些操作符是适用于任何应用的好选择。然而，需要大量的实验来选择正确的操作符，并进行微调，以使其在所有条件下可靠地工作。并非所有机器视觉应用都需要预处理。

分割

通常需要对图像进行分割：即识别图像中的不同区域。同样，程序员可以选择各种技术。请参见图34和图33的示例。通常，应用的要求会使熟练的图像处理程序员很容易选择合适的技术，但为了在应用的图像上获得最佳结果，仍需要时间和实验来调整分割过程。

与预处理类似，分割并非所有应用都需要。

特征提取

机器视觉的定义表明，从图像中获取数据是必不可少的。从图像中提取的特征就是这些数据。每个机器视觉过程都必须从图像中提取特征。请参见图35和图36的示例。

从图像中可以提取出数百种特征。通常只需要其中的几个特征。通常，从视觉系统的要求中很容易确定所需的特征。

机器视觉的定义表明，从图像中获取数据是必不可少的。从图像中提取的特征就是这些数据。

解释

拥有特征还不足以完成任务。需要进行解释。零件是好还是坏？将机器人发送到哪里来取零件？应将零件放入哪个容器？

经典的解释方法是决策树（见图37）。它由“如果-那么-否则”语句组成，这对于任何有过编程经验的人来说都是熟悉的。

其他机器学习技术也有用武之地，比如线性鉴别器（见图38）。

图像分析工具

大多数机器视觉软件包都提供工具来执行任务，从而消除了机器视觉程序员需要整理和尝试数百种算法的需求。这些工具涵盖特定功能，如：

对象识别、定位和方向
测量（例如距离、宽度、直径）
缺陷检测
焊缝跟踪
光学字符识别（OCR）
光学字符验证（OCV）
代码阅读（条形码和二维码）

深度学习

机器视觉图像分析领域的最新主要趋势是深度学习。深度学习使用一个具有多个内部层的神经网络，并将图像作为其输入。内部层对用户或者通常连机器视觉工程师都不可见。一套训练图像用于训练这个网络。在每次训练过程中，根据输出的误差，每个层的系数会被调整一小部分。

最常见的网络方法是卷积神经网络（CNN）。这种方法被描述为使用数据而不是计算机代码进行编程。

尽管深度学习正在解决一些非常困难的机器视觉问题，但它并非万能的。专家们一致认为，如果一个应用可以通过工具和算法来解决而不费太多努力，那么这条路线将比使用深度学习更容易。

虽然深度学习是“用数据编程”，但它需要大量正确标记的数据集来训练网络以可靠地执行任务。数据采集和标记的成本绝非微不足道，并且比训练网络本身需要更多的时间。

原网址: 访问
创建于: 2024-03-01 10:49:14
目录: default
标签: 无

未标明原创文章均为采集，版权归作者所有，转载无需和我联系，请注明原出处，南摩阿彌陀佛，知识，不只知道，要得到

上一篇：机器视觉与计算机视觉 - 知乎
下一篇：机器视觉基础知识 Fundamentals of Machine Vision（图像） - 知乎

请先后发表评论

最新评论
总共0条评论

加入组织

1. 手Q扫左侧二维码

2. 搜Q群：861085013

3. 点击

热门标签

最新评论

我是果粉我怕谁2025-03-22 12:33:13
在KBDfans 传承经典灵感源计算机 ...中评论
测评视频：【是的我买了把古早笑话 / Command65 R2】https://...

我是果粉我怕谁2024-02-22 16:27:15
在用arthas定位程序响应缓慢故障-天翼...中评论
[arthas@21932]$ profiler startAsyncProfi...

我是果粉我怕谁2024-02-21 11:26:28
在SpringBoot:Windows平台...中评论
文章提到的cronolog.exe，在https://deepmind.t-sa...

我是果粉我怕谁2023-07-28 16:45:41
在问题记录2 - SpringBoot+Z...中评论
InterProcessMutex mutex = new InterProce...

我是果粉我怕谁2023-06-06 14:23:41
在如何使用 Apache POI 在 Wo...中评论
不大行，到底哪里有问题？1. 没有分页，内容全在同一页；

上海晶珩EDATEC2023-03-24 11:17:58
在树莓派打造成小型PLC工控机(CodeS...中评论
使用真正的树莓派工控机开发CodeSys是否更好？网上看到过上海晶珩的树莓派工...

我是果粉我怕谁2023-03-23 10:00:15
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
https://github.com/tmk/USB2USB_Converter...

我是果粉我怕谁2023-03-23 10:00:08
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
https://github.com/tmk/HHKB_controller

我是果粉我怕谁2023-03-23 09:57:41
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
usb-to-usb-converter

我是果粉我怕谁2023-03-23 09:43:52
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
Hasu USB to USB Controller Converter

我是果粉我怕谁2023-03-23 09:40:37
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
u2u converter

我是果粉我怕谁2023-03-23 09:40:28
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
U2U Adapter

空灵橙子2023-03-17 13:16:32
在树莓派打造成小型PLC工控机(CodeS...中评论
您好，我们想进行文章方面的合作，请问怎么可以联系到您？

JUSTwithBG2023-03-10 11:48:16
在GoLand激活码，2022年最新永久激...中评论
刚在b站试了大佬的教程，牛逼炸了。goland官网最新版2022.3.2直接激活...

我是果粉我怕谁2022-10-03 18:16:30
在自行搭建开坑真正的客制化中评论
YUNRUN60铝合金外壳

我是果粉我怕谁2022-10-03 18:15:04
在自行搭建开坑真正的客制化中评论
当cheap60不再cheap？五鱼SARDINE 64 PC一体升级下盖！

我是果粉我怕谁2022-09-16 01:38:20
在Google 的核心 Java 库 gu...中评论
别再造轮子了，Google 开源的 Guava 工具库真心强大！https://...

我是果粉我怕谁2022-09-15 20:59:33
在如何访问gorm.Model.ID？--...中评论
I worked with this: removing package Nam...

我是果粉我怕谁2022-07-26 23:20:02
在GoLand激活码，2022年最新永久激...中评论
每天提供两个地址，保证有效！百度网盘：链接: https://pan.baidu...

我是果粉我怕谁2022-07-26 12:00:18
在go get更换国内镜像源_goldVi...中评论
Go Modules Environment

友情链接

Laravel China 简书知乎博客园 CSDN博客开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客淘宝中间件团队美团技术博客 360技术博客古巷博客 - 一个专注于分享的不正常博客软件测试知识传播 - 测试窝有赞技术团队阮一峰语雀静觅丨崔庆才的个人博客软件测试从业者综合能力提升 - isTester IBM Java 开发使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程蘑菇博客 - 专注于技术分享的博客平台个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区