公司新闻
资料下载
产品目录
联系我们
点击这里给我发消息

技术文章

图像处理

数字图像性质
 
数字图像具有一些度量和拓朴性质,与我们在基础微积分中所熟悉的连续两维函数的性质有所不同。另一个不同点在于人对图像的感知,因为对图像质量的判断也是重要的。
 
数字图像的度量和拓朴性质
 
 一幅数字图像由有限大小的像素组成,像素反映图像特定位置的亮度信息,通常(从此以后我们都这样假设)像素按照矩形采样栅格布置。我们用两维矩阵来表示这样的数字图像,矩阵的无素是整数,对应于亮度范围的量化级别。
 连续图像所具有的一些明显的直觉特性在数字图像领域中没有直接的类似推广[Pavlids 77,Brd andBrown 82]。距离(distance是一个重要的例子。坐标为(i,j)和(h,k)的丙点间的距离可以定义为几种形式,经典几何学和日常经验中的欧氏距离(Euclidean distanceDE定义为:
De[(i,j),(h,k)]=(I-h)2+(j-k)2
 欧氏距离的优点是它在事实上是直观且显然的。缺点是平方根的计算费时且其数值不是整数。
 两点间的距离也可以表示为在数字栅格上从起点移动到终点所需的*少的基本步数。如果只允许横向和纵缶的移动,就是距离D4。D4也称为“城市街区(cityblock)”距离,这是因为:它类似于在具有栅格状街道和封闭房子块的城市里的两个位置的距离。
D4[(i,j),(h,k)]=│i-h│+│j-k│
在数字栅格中如果允许沿对角线方向的移动,我们就得到了距离,常称这为“棋盘()”距离。距离等于国王在棋盘上从一处移动到另一处所需的步数。
D8[ (i,j), (h,k) ]=max{│I-h│,│j-k│}
任何距离都可以作为斜切(chamfering)的基础,在切中产生像素与某个图像子集(多半表示某种特征)的距离。所产生的图像在该子集元素位置处的像素值为0,邻近的像素具有较小的值,而远处的数值就大,该技术的命名源于这个阵列的外观。斜切在斜面匹配(chamfer matching中有价值,。如下的两遍算法是基于简化了的欧氏度量导出的[Barrow etal.77],原出处是[Rosenfeld and Pfalz 68]。
AL
AL
BR
AL
AL
BR
BR
AL
BR
BR
图1斜切中使用的像素领域——像素p位于中心

算法1:斜切

 
 

 

 

1. 按照一种距离度量D,D是D4或D8对大小为M×N的图像的一个子集S做切,建立一个的数组F并进行初始化:子集S中的置为0其他置为无穷。
2. 按行遍历图像,从上到下、从左到右。对于上方和左面的邻接像素,如图1的AL所示的集合,设:
F(p)= min[F(p),D(p,q)+F(q)]
                                 q∈AL
3. 按行遍历图像,从下到上,从右到左。对于下方和右面的邻接像素,如图1的BR所示的集合。设:
F(p)= min[F(p),D(p,q)+F(q)]
q∈BR
4. 数组F中得到的是子集S的斜切。
 

这个算法在图像边界处显然需要调整,因为这些位置上集合AL和BR被截断了。
像素邻接性(adjacency是数字图像的另一个重要概念。任意两个像素如果它们之间的距离D4=1,则称彼此是4-邻接(4-neighbors的。类似地,8-邻接(8-neighbors指的是两个像素之间的距离D8=1。4-邻接和8-邻接参见图2。
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
                    图2 像素邻接性
由一些彼此邻接的像素组成的重要集合,我们称之为区域(region),这是一个重要的概念。对于熟悉集合论的读者,我们可以简单地说区域是一个连通集。更具描述性的说法是,如果我们定义从像素P到像素Q的路径为一个点序列A1,A2,……An,其中A1=P,An=Q,且Ai+1是Aì的邻接点,ì=1,..,n-1那么区域(region)是指这样的集合,其中任意两个像素之间都存在着完全属于该集合的路径。
如果一幅图像的两个像素之间存在一条路径,那么这些像素就是连通的(contiguous)。因此,我们可以说区域是彼此连通的像素的集合。“连通”关系是自反的、对称的且具有传递性的,因此它定义了集合(在我们的情况下是图像)的一个分解,即等价类(区域)。
假设Ri是“连通”关系产生的不相交的区域,进一步假定(为了避免特殊的情况)这些区域与图像的边界(是指图像矩阵中具有*小和*大标号的行和列)不接触。设区域R是所有这些区域Ri的并集,这样我们就可以定义区域R相对于图像的补集合RC。我们称包含图像边界的RC的边通子集合为背景(back-ground,而称补集合Rc的其他部分为孔(hole1.如果区域中没有孔,我们称之为简单连通(simply contiguou区域。有孔的区域称为复连通(multiply contiguou)。
请注意,区域概念只使用了“连通”性。我们可以给区域赋予第二属性,这些源于对图像数据的解释。我们常称图像中的一些区域为物体(object,决定图像中哪些区域对应于世界中的物体的过程是图像分割(segmentation
像素的亮度是一种非常简单的性质,在有些图像中可以用于寻找物体,例如,如果一个像素比先给定的值(阈值)暗的话就属于物体。所有这样的点的连通集构成一个物体。一个孔由非物体的点组成且物体的点组成且被子物体所包围,所有其他的点就构成了背景。
例如,白纸上印刷的黑色文本,其中字母是物体。字母包围的白色范围是孔,例如,字母O的内部。纸的其他部分是背景。
定义在方形栅格上的邻接性和连通性造成一些悖论(paradoxe)。例如给出两条45O的数字线段。如果使用4-邻接,线条上的点都是不连通的。其中还显示一种与线条性质的直觉理解相盾的更的情况:两条相互垂直的直线在一种情况下的确相交,但是在另一种情况下却不相交,这是因为它们根本没有任何共同点(即它们的交集是空)。
在欧氏几何学中,我们知道每个封闭的曲线(例如,一个圆)将平面分割成两个不连通的区域。如果图像数字化为一个邻接的方形栅格,我们可以从封闭曲线的内部到其外部画一条线但不与该曲线相交。这意味着曲线的内部和外部构成一个区域。这是因为线上的所有点属于一个区域。这是另一个悖论。
解决连通性悖论的一种方法是,对物体用邻接处理,面对背景用邻接处理(或反过来)。有关二值和更多亮度级别的数字图像悖论,在[Pavlidis77,Horn 86 ]中有更为严格的处理及解决方法。
这些问题对于方形栅格是很典型的,但是对于六边形栅格很多问题就不存在了。六边形光栅中的任何点与其6个邻接点的距离都相同。六边形光栅也有一些自身的特殊问题,比如,它很难用立叶变换来表示。
解决连接(connectivity)性问题的另一种方法是使用基于单元复合(cell complex)的离散拓朴[Kovalevsky89]。这种方法得出了一整套有关图像编码与分割的理论,其中涉及的许多问题这们在后面会遇到,比如边界和区域的表示问题。这种思想*早是Riemann在19世纪提出来的,它考虑的是不同维数的集合的族,0维的点可以赋给含有更高维结构(比如像素数组)的集合,这样可以排除我们所见到的悖论。
考虑到简单性和易于处理,尽管存在上述缺欠,多数数字化转换器仍然使用方形栅格。
区域的边界(border是图像分析中的另一个重要概念。区域R的边界是它自身的一个像素集合,其中的每个点具有一个或更多个R外的邻接点。该定义与我们对边界的直觉理解相对应,即边界是区域的界限上的点的集合。有时我们称这样定义的边界为内部边界(inner border,以便与外部边界(outerborder)相区别,外部边界是指区域的背景(即区域的补集)的边界。
边缘(edge更深一步的概念。它是一个像素和其直接邻域的局部性质,它是一个有大小和方向的矢量。边缘计算匠对象是具有很多亮度级别的图像,计算边缘的方式是计算图像函数的梯度。边缘的方向与梯度方向垂直,梯度方向指向函数增长的方向。
请注意,“边界”与“边缘”是不同的。边界是与区域有关的全局概念,而边缘表示图像函数的局部性质;边界与边缘也是关联的,一种寻找边界的方法是连接显著的边缘(在图像函数上具有大梯度的点)。
边缘性质隶属于一个像素及其邻域,有时评定两个像素对之间的性质也是有益的,裂逢边缘(crackedge就是这样的一个概念。每个像素有四个裂缝边缘,由其4-邻接关系定义而得。裂缝边缘的方向沿着亮度增大的方向,是90的倍数,其幅值是相关像素对亮度差的优良值。
图像的拓朴性质(topological property对于橡皮面变换(rubber sheettransformation具有不变性。想象一下在一个小的橡皮球表面上绘制物体的情况,物体的拓朴性质是在橡皮表面任意伸展时都具有不变性的部分。伸展不会必变物体部分的连通性,也不会改变区域中局限性的数目。Euler-Poincaré特征(characteristic是图像的一个拓朴性质,定义为区域数与其中的孔数的差值。
凸包(convex hull是用来表述物体拓朴性质的一个概念。凸包含物体的一个*小区域,该区域中任意两点之间的连线都属于本区域。例如,考虑一个形状类似于字母R的物体。想像一个细橡皮带紧绕着物体,橡皮带的形状就反映了物体的凸包。
非规则形状的物体可以用一组它的拓朴分量来表示。凸包中非物体的部分称为凸损(deficit of convexity,它可以分解为两面三刀个子集。其一是湖(lake,完全被物体所包围;其二是海湾(bay,与物体凸包的边界连通。
凸包、湖和海湾有时用来描述物体。
直方图
 图像的亮度直方图(brightness histogramhf(z)给出图像中亮度值z出现的频率,一幅有L个灰阶的图像的直方图由具有L个元素的一维数组表示。

算法.2:计算亮度直方图

 
 

 

 

1. 数组hf的所有元素赋值为0
2. 对于图像f的所有像素,做hf[f(x,y)]+1处理。
 

前面我们曾讲过,图像可以作为随机过程实现来分析,故可以考虑一阶密度函数p1(z,x,y),它表示像素(x、y)的亮度值z。如果不考虑像素的位置,我们得到一个密度函数p1(z),亮度直方图就是它的估计。
    直方图通常用条状图来显示。
   直方图通常是有关图像的唯壹可得到的全局信息。在寻找*佳的照明条件以便抓取图像、进行灰阶度换以及将图像侵害为物体和背景这些场合,都要用到直方图。请注意,同一直方图可能对应几幅图像,例如,当背景是常数时物体位置的改变不会影响直方图。
 
数字图像的直方图一般都有很多局部极小值和极大值,这会便进一步的处理变得复杂。这个问题可以通过对直方图进行局部平滑来解决,比如,可以用相邻直方图元素的局部平均来做,因此新的直方图可按下式来计算:
hf (z)=∑hf (z+i)
其中K是一个常量,代表平滑所使用的领域的大小。这个算法需要某种边界调整,也不能保证去除所有的局部极小。还有一些其他平滑技术,重要的有高斯模糊(Gaussianblurring),在直方图的情况下,它是2D高斯模糊的简化。
三图像的视觉感知
我们在设计或使用数字图像处理算法或设备时,应该考虑人的图像感知原理。如果一幅图像由人来分析的话,信息应该用人容易感知的变量来表达,这些是心理物理参数,包括对比度、边界、形状、纹理、色彩等等。只有当物体能够毫不费力地从背景中区分出来时,人才能从图像中发现它们。人的图像感知产生很多错觉,了解这些现象对于理解视觉机理有帮助。我们这里将提到其中比较为人熟知的一些错觉。
如果人的视觉系统对复合输入剌激的响应是线性的,即是各自剌激的简单的和,问题就会相对容易些。一些剌激的衰减,即图像中物体的部分区域,可以通过亮度、对比度、持续时间来补偿。事实上,人的感知敏感度大致上是与输入信号的强度成对数关系的。在这种情况下,经过一个初始的对数变换,复合剌激的响应可以作为线性的看待。
对比度(contrast
对比度是亮度的局部变化,定义为物体亮度的平均值与背景高亮度的比值。人的眼睛对亮度的敏感性成对数关系,意味着对于同样的感知,高亮度需要高的对比度。
表观上的亮度很大程度上取决于局部背景的亮度,这种现象被称为条件对比度(conditional contrast)。
敏锐度(acuity
敏锐度是觉察图像细节的能力。人的眼睛对于图像平面中的亮度的缓慢和快速变化敏感度差一些而对于其间的中等变化较为敏感。敏锐度也随着离光轴距离的增加而降低。
图像的分辨受制于人眼的分辨能力,用比观察都所具有的更高的分辨率来表达视觉信息是没有意义的。光学中的分辨率定义为如下的*大视角的倒数:观察者与两个*近的他所能够区分的点之间的视角。这两个点再近的话,就会被当作一个点。
 
人对物体的视觉分辨率在物体位于眼睛前250处。照明度在500的情况下*好,这样的照明是由400远的60灯泡提供的。在这种情况下,可以区分的两个点这间的距离大约是0.16MM。
物体边界(object border
物体边界具有大量的信息。物体和简单模式的边界,比如斑点或线,能引起适应性影响(adaptationeffects),类似于前面讲过的条件对比度。
色彩(color
由于在正常的照明条件下,人眼对色彩比亮度更敏感,因些色彩对于感知十分重要。,色彩可以表示为红、绿、蓝(RGB)三原色彩感知用HIS坐标系统来表示更好。
色彩感知与其他心理物理量一样也受类似的适应性错觉(adaptation illusion)的影响。
 
图像品质
在图像的捕获、传输或处理过程中可能使图像退化,图像品质的的度量可以用来估计退化的程度。我们对图像品质的要求取决于具体的应用目标。
估计图像品质的的方法可分为两类:主观的和客观的。主观的方法常见于电视技术中,其中*终评判标准是一组挑选出来的内行和外行观众的感觉。他们根据一张标准清单通过给出估计评分来评价图像。
度量图像品质的客观定量方法对我们更重要。理想的情况是,这样的方法同时也提供了主观的测试,且易于使用,这样晕介就可以将该标准用于参数优化。图像f(x,y)的品质通常通过与一个书籍的参考图像g(x,y)进行比较来估计]。为这一目的,常常要使用合成的图像作为参考图像。有一类方法使用简单的度量,比如均方差∑∑(g-f)2。这种方法的总是是不可能把几个大的差别与许多小的差别区分开来。除了均方差之外,还可以作用平均的优良差或者简单的*大的优良差。图像F和G这间的相关运算也是一种选择。
另一类方法是测量图像中小的或*近的物体的分辨率。由黑白条纹组成的图像可以用于这一目的,这时每毫米黑白条纹对数目就给出了分辨率的大小。
图像相似度的度量变得越来越重要了,这是因为它有助于图像数据库的检索。
图像中的噪声
实际的图像常受一些随机误差的影响而退化,我们通常称这个退化为噪声(noise)。在图像的捕获、舆或处理过程中能出现噪声,噪声可能依赖于图像内容,也可能与其无关。
噪声一般由其概率特征来描述。理想的噪声,称作白噪声(whitenoise)。具有常量的功率谱,也就是说其强度并不随着频率的增加而衰咸。白噪声是常用的模型,作为退化的*坏估计。使用这种模型的优点是计算简单。白噪声的一个特例是高斯噪声(Gaussiannoise)。服从高斯(正态)分布的随机变量具有高斯曲线型的概率密度。在一维的情况下,密度函数是:
 
基其中和分别是随机变量的均值和标准差。在很多实际情况下,噪声可以很好地用高斯噪声来近似。
当图像通过信道传输时,噪声一般与出现的图像信号无关。类似的噪声也出现在老式的摄像机中。这种独立于信号的退化被称为加性噪声(additivenoise),可以用如下的模型来表示:
f(x,y)=g(x,y)+v(x,y)
其中,噪声v和输入图像g是相互独立的变量。下面的算法用来在图像中产物具有O均值的加性高斯噪声,它常常可用于测试或验证本书中的许多其他算法,这些算法是用来消除噪声或者是具有抗噪声性质的。

算法3:产生加性零均值高斯噪声

 
 

 

 

1. 给取一个值,它的值小时,相应的噪声也小。
2. 如果图像的灰阶范围[0,G-1],计算
p[i]=
3. 对于亮度为g(x,y)的像素点(x,y),产生一个位于[0,1]范围内的随机数qi。确定
j=arg min(q1 –p[i])
4. 从集合{-1,1}中产生一个随机数q2。设:
f*(x,y)=g(x,y)+q2j
5. 设:
f(x,y)=0 当f*(x,y)<0
f(x,y)=G-1f*(x,y)>G-1
f(x,y)= f*(x,y) 其他
6. 转到第3步,直到扫描完所有的像素。
 

.
根据公式,台以定义信噪比SNR(signal-to-noiseratio。计算噪声贡献的所有平方和:
E=∑v2(x,y)
(x,y)
将它与观察到的信号的所有平方和进行比较,
F=∑f2(x,y)
(x,y)
信噪比就是:
SNR=F/E
(严格地说,我们测量的是对应于平均误差的平均观测值,所以计算显然是一样的)。SNR是图像品质的一个度量,值越大越好。
噪声的幅值在很多情况下与信号本身的幅值有关。如果噪声的幅值比信号的幅值大很多时,我们可以写成:
f=g+vg=g(1+v)≈gv
这种模型表达的是乘性噪声(multiplicativenoise。乘性噪声的一个例子是电视光栅退化,它与电视扫描线有关。在扫描线上*大,在两面三刀条扫描线之间*小。另一个乘性噪声的例子是胶片材料的退化,这是由感光乳剂有限大小银颗粒(silvergrain)所引起的。
量化噪声(quantizationnoise会在量化级别不中时出现,例如,仅有50个级别的单**像,这种情况下会出现伪轮廓。量化噪声可以被简单地消除。
冲激噪声(impulsivenoise是指一幅图像被个别噪声像素破坏,这些像素的亮度与其领域的显著不同。胡椒盐噪声(salt-peppernoise是指饱和的冲激噪声,这时图像被一些白的或黑的像素所破坏。胡椒盐噪声会使二值图像退化。
如果对于噪声的性质没有任何先验知识,局部处理方法是合适的。如果事先知道噪声的参数,可以使用图像复原技术。
上一篇:暂无
下一篇:暂无
深圳市创科自动化控制技术有限公司
电话:   传真:  地址:   邮编: