会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 测量仪器和方法 / CIE 色度图 / 针对色度下采样的图像格式的抖动

针对色度下采样的图像格式的抖动

阅读:476发布:2020-05-11

IPRDB可以提供针对色度下采样的图像格式的抖动专利检索,专利查询,专利分析的服务。并且本文描述了用于图像的抖动技术。第一比特深度的输入图像被分成亮度和一个或更多个色度分量。人类视觉系统(HVS)的光学传递函数(OTF)的模型被用来生成添加到输入图像的色度分量的抖动噪声。OTF的模型响应于基于色度分量的空间分辨率而确定的观看距离而被调整。基于原始输入亮度分量和噪声修改后的色度分量的图像被量化到比第一比特深度低的第二比特深度以生成输出抖动图像。,下面是针对色度下采样的图像格式的抖动专利的具体信息内容。

1.一种利用处理器来使图像抖动的方法,该方法包括:接收第一比特深度的输入图像,该输入图像以包括亮度分量和一个或更多个色度分量的第一颜色格式被表示;

生成白噪声;

根据人类视觉系统(HVS)的光学传递函数(OTF)的倒数来滤波白噪声以生成抖动噪声,其中,OTF至少响应于水平观看距离或垂直观看距离而被调整;以及将抖动噪声添加到所述一个或更多个色度分量以生成噪声修改后的色度分量。

2.如权利要求1所述的方法,还包括将抖动噪声添加到亮度分量以生成噪声修改后的亮度分量。

3.如权利要求1所述的方法,还包括:

将亮度分量和噪声修改后的色度分量转换成第二颜色格式的第二图像;以及量化第二图像以生成第二比特深度的输出抖动图像,其中,第二比特深度比第一比特深度低。

4.如权利要求2所述的方法,还包括:

量化噪声修改后的亮度分量和所述一个或多个噪声修改后的色度分量以生成第二比特深度的输出抖动图像(252),其中,第二比特深度比第一比特深度低。

5.如权利要求1所述的方法,还包括:

量化亮度分量和噪声修改后的色度分量以生成第二比特深度的输出抖动图像(249),其中,第二比特深度比第一比特深度低。

6.如权利要求1所述的方法,其中,白噪声包括两个或更多个单独白噪声输出,其中,每个噪声输出是利用不同种子数而生成的。

7.如权利要求1所述的方法,其中,OTF的模型包括以下函数其中,d表示以mm为单位的人类瞳孔的尺寸,f包括以周期/度为单位的输入空间频率。

8.如权利要求7所述的方法,其中,d=3mm。

9.如权利要求7所述的方法,其中,通过利用以下转换函数将频率在周期/度到周期/像素之间转换来将OTF模型调整到数字图像域其中,D表示以像素为单位测得的观看距离。

10.如权利要求1所述的方法,其中,输入图像的至少一个色度分量包括比输入图像的亮度分量的空间分辨率低的空间分辨率。

11.如权利要求10所述的方法,其中,输入图像的至少一个颜色分量的水平分辨率是输入图像的亮度分量的水平分辨率的一半。

12.如权利要求1所述的方法,其中,第一颜色格式包括4:2:2或4:2:0YCbCr颜色格式。

13.如权利要求1所述的方法,其中,水平或垂直观看距离中的至少一个基于输入图像的色度分量中的一个色度分量的空间分辨率而被确定。

14.如权利要求6所述的方法,其中,白噪声输出的分量中的每个分量被单独滤波以生成一个或更多个抖动噪声分量。

15.如权利要求14所述的方法,还包括:

用第一噪声缩放因子缩放第一抖动噪声分量以生成第一缩放后的抖动噪声分量;以及用第二噪声缩放因子缩放第二抖动噪声分量以生成第二缩放后的抖动噪声分量,其中,第一和第二缩放因子响应于输入图像的局部区域分析而被确定。

16.如权利要求15所述的方法,其中,局部区域分析包括至少检测输入图像的像素是否在像素分量值的一个或更多个预定边界内。

17.如权利要求4所述的方法,其中,在将亮度分量和噪声修改后的色度分量转换成第二颜色格式的第二图像之前,噪声修改后的色度分量被升频以匹配亮度分量的空间分辨率。

18.如权利要求1所述的方法,其中,第一颜色格式是线性化的颜色格式。

19.如权利要求18所述的方法,其中,线性化的颜色格式是线性化的YCbCr、LMS或CIE XYZ。

20.如权利要求1所述的方法,其中,直到生成抖动噪声的步骤由处理器离线计算,而剩下的步骤由处理器或第二处理器实时计算。

21.一种利用处理器来使图像抖动的方法,该方法包括:接收第一比特深度的输入图像,该输入图像以包括第一空间分辨率的亮度分量和第二空间分辨率的一个或更多个色度分量的第一颜色格式被表示,第二空间分辨率至少在垂直或水平方向上比第一空间分辨率低;

生成白噪声;

根据第一低通滤波器的响应的倒数来滤波白噪声以生成色度抖动噪声,其中,第一低通滤波器的响应响应于第二空间分辨率而被调整;

根据第二低通滤波器的响应的倒数来滤波白噪声以生成亮度抖动噪声,其中,第二低通滤波器的响应响应于第一空间分辨率而被调整;

将亮度抖动噪声添加到亮度分量以生成噪声修改后的亮度分量;

将色度抖动噪声添加到所述一个或更多个色度分量以生成噪声修改后的色度分量;以及响应于量化噪声修改后的亮度分量和噪声修改后的色度分量来生成第二比特深度的输出抖动图像,其中,第二比特深度比第一比特深度低。

22.如权利要求21所述的方法,其中,第一低通滤波器和第二低通滤波器的响应与人类视觉系统的光学传递函数的模型的响应相匹配。

23.一种装置,包括处理器并且被配置成执行如权利要求1-22所述的方法中的任一种方法。

24.一种非暂时性计算机可读存储介质,其上存储有用于执行根据权利要求1-22中任一项所述的方法的计算机可执行指令。

说明书全文

针对色度下采样的图像格式的抖动

[0001] 相关申请的交叉引用
[0002] 本申请要求2013年4月29日提交的美国临时专利申请No.61/817,222以及2013年6月4日提交的美国临时专利申请No.61/830,806的优先权,二者通过引用被整体结合于此。

技术领域

[0003] 本发明一般地涉及图像。更具体地,本发明的一实施例涉及由色度下采样(subsample)的格式表示的图像的抖动(dithering)。

背景技术

[0004] 本文所使用的术语“抖动”表示有意地添加噪声以随机化由于向静态或运动图像或图片应用比特深度(bit-depth)变换而造成的量化误差的处理。应用抖动以使得当减小信号的比特深度时,量化输出信号的平均局部值具有与输入相同的比特深度。
[0005] 对于成像应用,当N比特图像被转换到P比特图像(其中P小于N)时,视觉系统起到平均处理的作用。例如,当从多比特深度信号(例如,N=8)变到二进制信号(例如,P=2)时,可以使用抖动。该情况也称作半色调化。在显示技术中,抖动可以被应用于降低输入的比特深度(例如,10个比特)以匹配目标显示器的较低的比特深度(例如,8个比特)。
[0006] 本文所使用的术语“动态范围”(DR)可以与人类视觉系统(HVS)感知图像中的强度(例如,亮度(liminance,luma))的范围的能力相关,例如从最深的深色到最亮的亮色。从这个意义上讲,DR与“所涉及场景”强度相关。DR还可以与显示器设备充分或近似呈现特定宽度的强度范围的能力相关。从这个意义上讲,DR与“所涉及显示器”强度相关。除非在本说明书中的任何点处明确指定特定意义具有特别的重要性,否则应当推断该术语可以(例如可交换地)用在任一意义中。
[0007] 本文所使用的术语高动态范围“HDR”与跨HVS的某14-15个数量级的DR宽度相关。例如,具有基本正常视力(例如,统计、生物或眼科意义中的一个或更多个)的很好适应了的人具有跨大约15个数量级的强度范围。已经适应了的人可以感知几个光子的昏暗光源。然而,这些相同的人可以感知沙漠、海洋或雪地中正午太阳的近乎刺眼的明亮强度(或者甚至瞥一瞥太阳,但是短暂地以防止受伤)。然而这种跨度适用于“适应了”的人(例如,其HVS具有重置和调整的时间段的人)。
[0008] 相反,相对于HDR,在强度范围中人类可以同时感知广泛宽度的DR可能有些缩短。本文所使用的术语“视觉动态范围”(VDR)或“增强的动态范围”(EDR)可以与能够被HVS同时感知的DR相关。如本文所使用的,VDR可以与跨5-6个数量级的DR相关,但是,其不意在被限制到动态范围的任何跨度,并且VDR(或EDR)可以窄于或等于HDR。
[0009] 直到最近为止,显示器具有比HDR或VDR明显更窄的DR。使用常规阴极射线管(CRT)、具有恒定荧光的白色背光的液晶显示器(LCD)或者等离子屏幕技术的电视(TV)和计算机监视器装置的DR呈现能力可能被限制到大约3个数量级。相对于VDR和HDR,这样的传统显示器因此代表了低动态范围(LDR)或标准动态范围(SDR)。数字影院系统展现了与其他显示器设备相同的一些限制。在本发明中,“视觉动态范围(VDR)”意在指示任何扩展的动态范围,其宽于LDR或SDR,而可以窄于或等于HDR。
[0010] 在实践中,图像包括一个或更多个颜色分量(例如,亮度Y和色度Cb和Cr或R、G和B),其中每种颜色分量用每像素N比特(例如,N=8)的精度来表示。尽管亮度动态范围和比特深度不是等同的实体,但是它们通常相关。其中N≤8(例如,彩色24比特JPEG图像)的图像被认为是标准动态范围的图像,而N>8的图像可以被认为是具有高动态范围性能的图像。VDR和HDR图像也可以使用诸如由Industrial Light and Magic开发的OpenEXP文件格式之类的高精度(例如,16比特)浮点格式来存储和分发。
[0011] 尽管在显示处理中有最新进展,但是硬件限制可能仍然制约VDR图像和视频的处理管线的比特深度精度。如发明人在这里所认识到的,希望开发用于使图像抖动的改进的技术。
[0012] 该部分中描述的方法是可以被探求的方法,但不一定是之前已经想到或探求过的方法。从而,除非以其他方式指示,否则不应当假设该部分中所描述的方法中的任何一个因其包含在此部分中而适格作为现有技术。类似地,除非以其他方式指示,否则对于一个或更多个方法识别出的问题不应当基于该部分而被假设为在现有技术中已经被认识到。

附图说明

[0013] 在附图的各图中本发明的实施例以示例而不是通过限制的方式示出,其中类似的附图标记指代类似的元件,并且其中:
[0014] 图1A示出人类视觉系统的光学传递函数(OTF)的示例;
[0015] 图1B示出人类视觉系统的光学传递函数的倒数的示例;以及
[0016] 图2A和2B示出根据本发明实施例的用于使色度下采样图像抖动的示例处理。

具体实施方式

[0017] 本文描述了用于图像的抖动技术。人类视觉系统(HVS)的光学传递函数(OTF)的模型被用来整形(shape)添加到色度下采样的视频信号的颜色分量的噪声。在以下描述中,出于说明的目的,列出了大量具体细节以提供对本发明的透彻理解。但是,清楚的是,本发明可以在没有这些特定细节的情况下被实践。在其他实例中,没有详尽描述熟知的结构和设备,以避免不必要的模糊本发明。
[0018] 概述
[0019] 本文描述的示例实施例涉及图像的抖动。第一比特深度的输入图像被分成亮度分量和一个或更多个色度分量。人类视觉系统(HVS)的光学传递函数(OTF)的模型被用来生成添加到输入图像的色度分量的抖动噪声以生成噪声修改后的色度分量。抖动噪声是通过使用基于OTF的倒数的滤波器来滤波伪随机白噪声而生成的,其中OTF模型响应于基于下采样色度分量的空间分辨率确定的观看距离而被调整。
[0020] 在一个实施例中,抖动输出图像是通过将输入亮度分量和噪声修改后的色度分量量化到低于第一比特深度的第二比特深度而生成的。
[0021] 在另一实施例中,输入亮度分量和噪声修改后的色度分量在被量化到第二比特深度以生成抖动输出图像之前被转换到第二颜色格式的第二图像。
[0022] 在一些实施例中,输入图像信号在被抖动之前被转换到线性化颜色空间。
[0023] 在一些实施例中,OTF模型基于用于固定瞳孔尺寸的Deeley OTF模型。
[0024] 在一些实施例中,经滤波的白噪声在被添加到色度分量之前根据输入图像的局部区域分析被进一步调整。
[0025] 基于OTF的抖动噪声生成的示例
[0026] 假定要向下量化到P比特图像的N比特输入图像(例如,N=8个比特)的序列,其中P<N个比特,那么在数字抖动期间,噪声在较低比特被丢弃或量化之前被添加到这些图像。基本的工程折衷是添加尽量多的噪声以通过比特深度降低处理使能对尽可能多的有效感知比特的保留,但是使噪声本身不可见。不可见性主要依赖于显示和观看距离参数。在一实施例中,用在图像抖动中的噪声源的噪声特性基于人类视觉系统(HVS)的光学传递函数(OTF)的模型来确定。
[0027] 从现在开始将被简单地表示为OTF的HVS的OTF是严格的低通函数,从而与HVS的对比敏感度函数(CSF)相比是对平均处理的更好的表示。此外,OTF在线性亮度域中是线性平移不变滤波器,而CSF是有时候被建模成滤波器和幅度非线性的组合处理的复杂非线性处理。最后,CSF的主要高频衰减是由OTF引起。
[0028] 在一示例性实施例中,抖动噪声可以被频谱整形以使得其为OTF的倒数,从而视觉系统的OTF的行为将导致感知上均匀、在所有频率处均等地可见的噪声。这将针对可见性的任何水平给出最大噪声方差。一般而言,该设计方法是为了保持抖动噪声对于所有频率均等地不可见。也就是说,OTF对噪声的影响是预补偿的,从而到达视网膜的噪声是白噪声。
[0029] OTF可以用从不同数据集产生的几种函数来建模,而使用的具体版本不重要。例如,Williams等人在“Double-pass and interferometric measures of the optical quality of the eye”,JOSA A 11.12(1994):3123-3135(其通过引用结合于此)中使用以下等式描述OTF:
[0030] M(s,s0)=D(s,s0)(w1+w2e-as)
[0031]
[0032] 其中s是单位为cy/deg(周期/度)的视觉频率,并且等式参数为a=0.1212,w1=0.3481,且w2=0.6519。
[0033] 另 一 个 常 见 的 OTF表 示 在Deeley,Robin J.,Neville Drasdo和 W.Neil Charman的“A simple parametric model of the human ocular modulation transfer function.”Ophthalmic and Physiological Optics 11.1(1991):91-93.中被描述,其整体通过引用被结合于此。
[0034] Deeley模型的优点是其针对瞳孔尺寸d被参数化。用于该OTF的等式由下式给出:
[0035]
[0036] 其中,f是单位为周期每度(cy/deg)的空间频率,d为单位为毫米(mm)的瞳孔尺寸。图1A示出根据等式(2)的对于3mm瞳孔(d=3)的OTF函数的示例。图1B示出图1A的倒数(1/OTF)。
[0037] 在一些实施例中,替代使用OTF函数,可以应用定义在HVS频率谱(例如,0到60cy/deg)内的任意低通滤波器。于是1/OTF噪声滤波器(220)可以用定义在HVS的频率谱内的任意高通滤波器来表示。
[0038] 为了将OTF应用到数字图像域,频率需要从cy/deg转换到cy/pixel(周期/像素)。(注意,0.5cy/pixel是奈奎斯特折叠频率,即,0.5cy/pixel是能够在数字图像中承载的最大可能频率)。以下等式被用来在视觉空间频率(以cy/deg为单位给出)到物理频率(诸如cy/mm)或数字频率(以cy/pixel为单位)之间进行转换:
[0039]
[0040]
[0041] 其中,D是观看距离,该观看距离或者以与等式(3)中的物理频率相同的单位(例如,mm)被测得或者以像素(见等式(4))为单位被测得。例如,当观看全高清(HD)电视(例如,使用1920x1080的像素分辨率)时,在常见的三个图片高度的观看距离(3H)处,D=3x1080=3240个像素。
[0042] 用于色度下采样的频谱整形
[0043] 在一示例实施例中,抖动被应用到具有视频信号的亮度/色度(luminance/chrominance或者luma/chroma)表示的信号,比如YCbCr、YUV、Lab等。在这样的表示中,大部分亮度信息被承载在Y或L信号中。色度分量信号(例如,CbCr)承载非常少的亮度信息,并被称为是近似等亮度的(isoluminant)或伪等亮度的。
[0044] 在一实施例中,抖动信号仅添加到诸如Cr和Cb的伪等亮度信号而不添加到亮度分量。这是因为噪声及其他空间模式(pattern)的可见性在亮度通道中比在色度通道中高得多。
[0045] 在一实施例中,噪声的频谱被基于色度分量的空间分辨率而整形,所述色度分量的空间分辨率可以与亮度分量的空间分辨率不同。例如,利用4:2:2色度采样,则色度分量在水平方向上以因子2被下采样。例如,1920x1080的视频信号可以包括1920x1080的空间分辨率的亮度信号分量(例如,Y)和960x1080的空间分辨率的色度信号分量(例如,Cb或Cr)。在另一示例中,利用4:2:0色度采样,则色度分量在水平和垂直两个方向上被以因子2下采样。于是1920x1080的视频信号可以包括960x540的空间分辨率的色度分量。
[0046] 在一实施例中,噪声在下采样后的域中被添加。在被最终显示之前,色度下采样后的图像被按需上采样以供显示(例如上采样到4:4:4的表示),并通常被从亮度/色度表示转换到RGB表示以驱动显示三原色。被添加到信号的抖动噪声也经历相同的处理并且其频谱被色度升频(upscaling)处理的几何结构改变。因此,其被设计为将被升频处理补偿以使得其在升频处理之后具有希望的频谱形状。该希望的频谱形状为如前所述的OTF的倒数。
[0047] 图2A示出根据本发明一实施例的用于使色度下采样的YCbCr图像抖动的示例处理。如在图2A中所示出的,抖动处理可以分为两部分:a)抖动噪声生成器的离线设计;以及b)实时抖动处理,其中噪声被添加到要被量化的信号。
[0048] 如图2A所示出的,但不局限于此,抖动噪声生成处理通常离线执行。在一实施例中,所得到的用于色度分量的抖动噪声模式可以被存储在存储器中;但是,只要有足够的计算资源,处理的这一部分就可以实时执行。
[0049] 如在图2A中所示出的,抖动噪声生成处理通过建立OTF模型而在步骤(205)中开始。在一示例性实施例中,但不局限于此,该OTF模型可以是针对d为固定值的等式(2)的Deeley模型。在一实施例中,d=3mm,表示亮光;但是OTF函数可以容易地针对其他光条件被调整。在步骤(210)中,原始OTF模型的输出可以被调整以使得其输出以cy/pixel为单位被表示,其中等式(4)中的观看距离(例如,D)表示在感兴趣的空间方向上对于下采样后的色度分量的观看距离。例如,对于HD 1920x1080的信号,以4:2:2格式被处理,对于用于垂直频率的OTF模型,DH=3H=3x1080=3240个像素。类似地,对于用于水平频率的OTF模型,DW=3HS=3x(1080/2)=3x540=1620个像素。
[0050] 基于等式(2)对于垂直和水平频率使用单独的OTF模型(例如,OTF(fh,d)和OTF(fw,d)),可以生成2-D OTF模型(例如,OTF(fh,fw))。在一些实施例中,该2-D模型可以是笛卡尔可分离的(例如,OTF(fh,fw)=OTF(fh,d)*OTF(fw,d))。在一些其他实施例中,联合模型可以是极坐标可分离的。
[0051] 总体而言,OTF函数是旋转对称的,从而其是极坐标可分离的;但是由于人与人的差异,笛卡尔模型也可以工作。在一示例实施例中,令
[0052]
[0053] 则OTF(fh,fw)=等式(2)的OTF(r,d)。
[0054] 步骤(235)表示二维白(例如,高斯)噪声生成器。在一优选实施例中,噪声生成器利用两个单独的伪随机生成器种子为色度通道中的每个色度通道生成不同的噪声输出(237-A和237-B)。在一示例实施例中,对于在(0,255)范围内的噪声输出,噪声生成器可以生成具有σ=30的白噪声。
[0055] 噪声生成器(235)的输出(237-A,237-B)中的每个被利用基于OTF的倒数(即,1/OTF)的滤波器滤波。滤波可以在空间域中或者在频率域中执行。由于OTF(215)通常在频率域中,因此在频率域中滤波包括a)比如通过使用快速傅里叶变换(FFT)将噪声生成器的输出(237)变换到频率域中,b)将变换步骤的输出乘以OTF的倒数,以及c)通过使用诸如逆FFT的逆变换将积变换回空间域。从而,噪声滤波器(220)的输出(222和224)表示要被添加到待被抖动的输入信号(例如,信号202)的色度分量(例如,202-Cr和202-Cb)的两组2D抖动噪声模式。
[0056] 如在图2A中所示出的,噪声滤波器(220)的输出可以可选地用权重WCb和WCr来缩放。在一个实施例中,这些权重可以是独立于图像的、根据目标显示器的特性(诸如其动态范围和三原色)而调整的。在另一实施例中,这些权重还可以基于输入图像(202)的局部区域分析而被进一步调整,以在检测到高度饱和的输入颜色的情况下进行补偿。在高度饱和的颜色区域的情况下,想要的等亮度噪声调制变成亮度调制。例如,对纯绿色(RGB=(0,1,0))的想要的Cr调制趋于表现为亮度调制,这是因为小的引入的红色调制在0附近,其是黑色的。想要的负的R调制被裁剪(clip),并且由于这些R子像素与G子像素(其被完全导通)相邻,因此红色的正调制将不被感知。此外,由于G在最大值处,因此任何正的G调制将被裁剪。从而在诸如这样的颜色区域中,更好的是,将色度调制整个平移到另一通道,例如在该示例中被平移到Cb通道。可以应用重新加权色度噪声调制的各种组合。作为示例,在一实施例中,假设在正常处理期间,WCb和WCr表示独立于图像的权重,则对于被确定为处于“完全红色”范围(例如,R>200、G<10且B<10)内的像素,局部区域分析步骤225可以如下调整两个权重:
[0057] 如果输入像素是“完全红色”
[0058] 则WCr=c1*WCr并且WCb=c2*WCb;
[0059] 其中c1和c2是预先确定的标量(例如,c1=0,且c2=2.0)。
[0060] 在一些实施例中,局部区域分析(225)可以在不同于输入颜色域(例如,YCbCr)的颜色域(例如,RGB)中操作。在一些其他实施例中,局部区域分析(225)可以在与输入颜色域(例如,YCbCr)相同的颜色域中操作。
[0061] 在可选加权(230-A和230-B)之后,抖动噪声被添加到输入信号(202)的色度分量(202-Cb和202-Cr)以生成噪声修改后的颜色分量(246-Cb,246-Cr)。抖动噪声(222和224)可以以比输入信号比特深度小的比特深度表示。在一实施例中,噪声和信号通过对准两个信号中的最低有效比特来相加。
[0062] 在抖动噪声的添加之后,原始亮度信号(202Y)和噪声修改后的色度信号(246-Cb和246-Cr)可以被直接量化,或者它们可以在步骤(245)中首先被转换到依赖于显示器的颜色空间(例如,RGB)。该步骤还可以包括色度分量的上采样以匹配亮度分量的分辨率。在(可选的)颜色变换(245)之后,其输出(247)可以针对各颜色分量利用本领域任何已知量化方案被量化到希望的比特深度(例如,P<N),从而生成输出抖动图像(249)。将滤波后的噪声添加到下采样的色度分量信号,随后转换回RGB,以及在RGB中比特深度的截断在图2的下半部分中被示出为实时处理。
[0063] 在一些实施例中,要被抖动的输入信号(例如,202)可以在伽马校正后的域中,其近似是亮度的幂函数(例如,1/2.2)。在一些实施例中,为了利用OTF滤波处理在线性亮度域中像线性滤波器那样工作的事实,附加的信号线性化步骤(未示出)可以先于噪声添加步骤(240-A和240-B)。在这样的实施例中(未示出),信号(202)可以通过以下操作生成:a)将原始输入YCbCr信号转换到RGB,b)向RGB信号应用逆伽马函数,以及c)转换回线性YCbCr(例如,Y’Cb’Cr’)。在一些其他实施例中,抖动噪声添加步骤可以在可替代的线性化颜色空间(例如,LMS或CIE XYZ)中执行。在这样的实施例中,颜色转换步骤(245)可以根据需要被调整(例如,LMS到RGB或者XYZ到RGB)。
[0064] 图2B示出了根据本发明另一实施例的用于使色度下采样的YCbCr图像抖动的示例处理。在图2A和图2B中示出的实施例之间的主要差别在于:在图2B中示出的系统中,抖动噪声被添加到伪等亮度号信号(诸如Cr和Cb)和亮度分量Y二者(202)。
[0065] 如在图2B中所示出的,作为“离线设计”的一部分,亮度相关的抖动信号(226)可以利用与如之前讨论的用于生成色度相关的抖动信号(222和224)的方法类似的方法来生成。在给定OTF模型(205)和在输入样本域中计算出的观看距离(208-Y)的情况下,输入OTF模型通过使用等式(3)和(4)被从cy/deg映射到cy/pixel表示。映射函数(210-C)和(210-Y)之间的关键差别在于:在(210-C),观看距离是在下采样的色度域中计算的,而在(210-Y)中,观看距离是在输入的全分辨率域中计算的。
[0066] 滤波器(220)现在包括三个单独的1/OTF滤波器,每个滤波器用于每种颜色分量,每个滤波器对由之前讨论的2D空间白噪声生成器(235)生成的白噪声进行滤波。噪声生成器(235)现在可以使用三种不同的种子,每种种子用于颜色分量中的每个。
[0067] 如在图2B所示出的,在实时处理步骤期间,噪声滤波器(220)的亮度相关的输出(226)也可以可选地由缩放器(230-C)利用权重WY来缩放。在可选加权(230-A、230-B、230-C)之后,抖动噪声被添加到输入信号(202)的色度分量(202-Cb和202-Cr)和亮度分量(202-Y)二者以生成噪声修改后的颜色分量(246-Cb、246-Cr和246-Y)。
[0068] 在添加抖动噪声之后,修改后的亮度信号(246-Y)和噪声修改后的色度信号(246-Cb和246-Cr)被量化器(250)利用本领域任何已知量化方案量化到希望的比特深度(例如,P<N),以生成输出抖动图像(252)。
[0069] 在一些实施例中,量化(250)之后可以是可选的颜色转换(245)(例如,YCbCr到RGB)到适于显示或其他后处理的颜色域,以生成抖动信号(254)。该步骤也可以包括色度分量的上采样以匹配亮度分量的分辨率。
[0070] 如在图2A中所示出的,在一些实施例中,颜色转换(245)可以先于量化步骤(250)。
[0071] 示例计算机系统实现方式
[0072] 本发明的实施例可以用计算机系统、以电子电路和部件配置的系统、诸如微控制器的集成电路(IC)设备、现场可编程门阵列(FPGA)或其他可配置或可编程逻辑设备(PLD)、离散时间或数字信号处理器(DSP)、专用集成电路(ASIC)和/或包括这样的系统、设备或部件中的一个或更多个的装置来实现。计算机和/或IC可以实施、控制或执行与图像抖动相关(诸如本文所述的那些)的指令。计算机和/或IC可以计算与本文所述的图像抖动相关的多个参数或值中的任何一个。图像抖动实施例可以在硬件、软件、固件及其各种组合中实现。
[0073] 本发明的某些实现方式包括计算机处理器,其执行使得处理器实施本发明方法的软件指令。例如,显示器、编码器、机顶盒、转码器等中的一个或更多个处理器可以通过执行对于处理器而言可访问的程序存储器中的软件指令来实现如上所述的用于图像抖动的方法。本发明还可以以程序产品的形式提供。该程序产品可以包括承载了包括指令的一组计算机可读信号的任何介质,当所述指令被数据处理器执行时,使得数据处理器执行本发明的方法。根据本发明的程序产品可以是各种形式的任何一种。该程序产品可以包括例如物理介质,所述物理介质诸如是包括软盘的磁数据存储介质、硬盘驱动器、包括CD ROM、DVD的光学数据存储介质、包括ROM、闪存RAM等的电子数据存储介质。在程序产品上的计算机可读信号可以可选地压缩或加密。
[0074] 其中以上提到的部件(例如,软件模块、处理器、组件、设备、电路等),除非以其他方式指示,对该部件的提及(包括提及“装置”)应当被解释为包括作为该部件的等同物的、执行所述部件功能(例如,功能上等同)的任何部件,其包括结构上不等同于所公开的结构(其执行本发明所例示的示例实施例中的功能)的部件。
[0075] 等同物、扩展、替代物和杂项
[0076] 与图像抖动相关的示例实施例从而被描述。在前述说明书中,已经参考不同实现方式之间可不同的大量具体细节描述了本发明的实施例。从而,本发明是什么的唯一且排他的指标以及申请人所想要的本发明是什么是一组权利要求发布的具体形式的、从该申请中发布出的该组权利要求,其包括任何后续的修正。对于包含在这样的权利要求中的术语的这里明确提出的任何定义应当决定如在权利要求中所使用的这样的术语的含义。因此,没有在权利要求中明确记载的限制、元件、性质、特征、优点或属性不应当以任何方式限制这样的权利要求的范围。从而,说明书和附图应当被视为说明性的而不是限制性的意义。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用