机器视觉基础知识 Fundamentals of Machine Vision(图像) - 知乎

版权声明: 本翻译文章为原文《Fundamentals of Machine Vision》原始来源:https://www.autovis.com/images/pdf/resources/fundamentals-of-machine-vision.pdf(作者:Peppy West - AUTOMATED VISION SYSTEMS, INC. San Jose, California 95124 U.S.A.)。作者和贡献者对原文内容享有版权。请阅读原文以了解详细信息和权限限制。翻译权归本翻译者所有,非商业用途,仅用于学术研究和交流目的。未经授权,不得用于商业目的或其他侵权行为。本翻译保留所有权利。如有引用或使用,请注明原文出处和作者。本翻译文章中的内容仅供参考,可能存在错误或不准确之处,请读者自行核实原文内容。

    • *

图像

由于图像在机器视觉中起着核心作用,所以我们可以从研究机器视觉中常见的图像开始。

首先,让我们定义一下图像的含义,因为在机器视觉中有两种主要类型的图像:光学图像和数字图像。光学图像是由镜头聚焦到图像传感器上的光能,而数字图像是从图像传感器读取并由计算机处理的图像。

光学图像

光学图像(见图1)实际上是聚焦的光能 - 是来自成像场景的光能的表示或再现。它是在图像传感器上创建的。由图像传感器创建的数字图像无法比光学图像中存在的信息或细节更多。

数字图像

图像传感器对光学图像进行空间和强度采样。在图2中,可以看到图像在水平和垂直方向上都进行了采样。每个采样点都是一个像素,即图像元素的缩写。

在图2中不太明显的是,每个像素具有离散值或灰度级别。对于大多数机器视觉图像,每个像素由一个8位数表示,取值范围从0到255。

水平和垂直方向的样本数,也就是像素的列数和行数,构成了图像的分辨率(见图3)。以前,640x480像素,即VGA分辨率,约为33万像素或1/3兆像素,是标准的分辨率。随着图像传感器技术的进步,图像分辨率从1到5兆像素是最常见的范围,但从VGA、1/3兆像素到70兆像素的图像分辨率都是常见的。

灰度图像

在机器视觉中最常见的图像是灰度图像。在灰度图像中,每个像素都有一个数值,该数值与图像传感器相应像素上接收的光能成比例,如图4所示。

通常情况下,这个数值由8位表示,数值范围从0到255。有些视觉系统使用10位或甚至12位的数值,数值范围为0到1,023或0到4,095。图像传感器及其电路有一个噪声成分,限制了可用的位数。

彩色图像

彩色图像(见图5)与灰度图像不同,每个像素有三个数值 - 一个用于红光能量,一个用于绿光能量,一个用于蓝光能量。

二值图像

二值图像(见图6)的像素只能有两个值:亮(通常用“1”表示)和暗(通常用“0”表示)。二值图像不是直接从相机获得的,而是通过图像处理创建的。阈值操作应用于图像,使得所有值低于阈值的像素变暗,而其他像素保持亮。阈值化是简化图像的一种方法,使其更容易处理。但并非适用于所有应用。

3D图像

虽然使用3D成像系统的范围正在迅速扩大,但本文除了简单提及外并未涵盖此主题。有十多种不同的技术能够创建3D图像。

最常见的3D图像与灰度图像完全相似。不同之处在于每个像素的值代表的是距离,而不是光亮水平的度量。有些3D系统提供距离和光亮水平的两个值,并为每个像素提供了两个数值。还有一些3D系统可以捕捉彩色图像和3D图像。通常情况下,这两种图像保持分开,但如果合并或融合在一起,结果是每个像素具有四个值。

许多3D成像系统不提供定期间隔的像素阵列,它们提供一组数据点,每个数据点都有X、Y和Z坐标。这种类型的图像被称为点云图像,如图7所示。


原网址: 访问
创建于: 2024-03-01 10:47:25
目录: default
标签: 无

请先后发表评论
  • 最新评论
  • 总共0条评论