视频信号分析转让专利

申请号 : CN200880015053.3

文献号 : CN101690177B

文献日 : 2012-02-15

为了检测视频信号中的隔行错误，本发明的方法接收连续的数字编码的帧，各帧包括第一类型场的数据和第二类型场的数据(即，顶场和底场，反之亦然)。该方法然后针对各第一类型场生成：第一差分信号(DIF1)，其代表该场与前一帧的第二类型场之间的差分；第二差分信号(DIF2)，其代表该场与同一帧的第二类型场之间的差分；第三差分信号(DIF3)，其代表该场与后一帧的第二类型场之间的差分。然后，根据差分信号的值，生成决策信号(wOFlag)，该决策信号表示该场与同一帧的第二类型场的估计出的时间关系。可以将该时间关系与表示所声称的时间关系的信号(IDFO)进行比较，并在不匹配的情况下生成警告信号(wEFlag)。

1.一种检测视频信号的场序的方法，该方法包括以下步骤：

接收连续的数字编码的帧，各帧包括第一类型场的数据和第二类型场的数据；

针对各第一类型场而生成：

-第一差分信号DIF1，其代表该场与前一帧的第二类型场之间的差分；

-第二差分信号DIF2，其代表该场与同一帧的第二类型场之间的差分；

-第三差分信号DIF3，其代表该场与后一帧的第二类型场之间的差分；以及-根据所述差分信号的值而生成决策信号，该决策信号表示该场与同一帧的第二类型场的估计出的时间关系。

2.根据权利要求1的方法，该方法包括以下步骤：接收表示所声称的时间关系的信号IDFO，将其与决策信号比较，并生成警告信号wEFlag。

3.根据权利要求1或2的方法，其中在多帧上分别对各差分信号求平均以产生相应的平均差分信号wDIF1、wDIF2、wDIF3，并通过对所述平均差分信号进行分析来获得所述决策信号。

4.根据权利要求1或2的方法，该方法包括以下步骤：根据所述差分信号针对各第一类型场而生成即时决策信号，然后根据多帧上的即时决策信号而生成组合决策信号。

5.根据权利要求1或2的方法，其中在多帧上分别对各差分信号求平均以产生相应的平均差分信号wDIF1、wDIF2、wDIF3，并通过对所述平均差分信号进行分析而获得加窗决策标记wDFlag；并且该方法包括以下步骤：根据所述差分信号针对各第一类型场而生成即时决策信号，然后根据多帧上的即时决策信号而生成累计决策标记；以及将所述加窗决策标记wDFlag和所述累计决策标记组合起来以生成总决策标记。

视频信号分析

[0001] 1.简介

[0002] 本发明涉及对例如根据BT.601[1]的隔行系统上显示的视频序列进行分析。在这样的系统中，使用不正确的场序(先顶场(top-field-first(TFF))或先底场(bottom-field-first(BFF)))可能导致隔行和逐行序列的显示都出现显著且不良的效果。

[0003] 根据本发明，提供了一种检测视频信号的场序的方法，该方法包括以下步骤：

[0004] 接收连续的数字编码的帧，各帧包括第一类型场的数据和第二类型场的数据；

[0005] 针对各第一类型场而生成：

[0006] -第一差分信号(DIF1)，其代表该场与前一帧的第二类型场之间的差分；

[0007] -第二差分信号(DIF2)，其代表该场与同一帧的第二类型场之间的差分；

[0008] -第三差分信号(DIF3)，其代表该场与后一帧的第二类型场之间的差分；以及[0009] -根据这些差分信号的值而生成决策信号(wOFlag)，该决策信号表示该场与同一帧的第二类型场的估计出的时间关系。

[0010] 在权利要求中阐述了本发明的其他方面。

[0011] 现在参照附图通过示例来描述本发明的一些实施方式，在附图中：

[0012] 图1到10及图12是用于说明本发明实施方式的定时图；

[0013] 图11是示出本发明一个实施方式的操作的功能框图；以及

[0014] 图12到27是示出所获得的结果的图。

[0015] 这里，提出了一种通过将目标场(顶场或底场)与三个相邻的相反(opposite phase)场进行滑动窗比较而对视频内容中的场序问题进行检测的方法。对于每个所分析的场，许多测量被生成并用来对包含目标场的帧进行“即时”分类。对这些帧结果进行缓存并作出相应的“加窗”决策。在“组合”分析技术中使用“即时”和“加窗”的结果来识别视频场序属性以及潜在的场序问题的性质和位置。而且，通过仅“即时”方法增强了用于识别重复帧逐行内容的问题区域的技术。

[0016] 2.图像结构

[0017] 在第3节中描述分析技术之前，先在本节中简要描述隔行和逐行视频属性。

[0018] 2.1隔行视频

[0019] 可以将先顶场隔行视频序列表示为如图1所示顶场和底场交替的序列。

[0020] 在时间上，B场应当位于相邻T场之间一半位置处。在空间上，B场在输出显示装置上垂直向下偏移1线并与对应T场隔行，如图2所示。

[0021] 对于PAL-625系统“I”标准分辨率显示器(每帧720×576个有效采样)，可视图像由场刷新率为50Hz(帧率为25Hz)的TFF隔行288线T和B场构成。对于NTSC-525系统“M”标准分辨率显示器(每帧720×480个有效采样)，可视图像由场刷新率为59.94Hz(帧率为29.97Hz)的BFF隔行240线T和B场构成。

[0022] 2.2逐行视频

[0023] 逐行视频序列的帧由仅相距一个时间间隔的若干条线组成，这些线例如通过电影胶片摄像机和新近的数字视频(DV)摄像机生成。考虑隔行显示呈现的场，逐行序列具有图3中所示的时间特征，其中对应的顶场和底场覆盖了相同时间间隔。然而，这些场仍然根据图2在空间上隔行，并且在显示中而根据图1在时间上隔行。

[0024] 如图4所示，在卡通内容中可能找到重复帧逐行视频。重复帧的模式通常是规则的，然而也可能有不规则重复。

[0025] 2.3场序问题

[0026] 以下简要考虑隔行和逐行内容二者的场序属性在隔行显示中如何会导致问题。

[0027] 2.3.1隔行内容

[0028] 不正确场序内容的隔行显示会导致显著的劣化。如果将BFF隔行内容以TFF方式显示，则在运动区域内可能出现可见的“抖动”效果。在图5和6中示出了该问题。图5示出了在整个显示器上以恒定速率移动的“X”模式的BFF场定时。

[0029] 图6示出了正确BFF显示的场序和不正确TFF显示的场序。对于TFF显示而言，“X”的移动的不连续性很明显。

[0030] 2.3.2逐行内容

[0031] 人们可能会觉得对于逐行内容而言场序不是一个问题，因为来自于一个逐行帧并用于重放的一对场将会来自同一个时间间隔。在重放中对任一个场序都不应当有运动“抖动”。然而，存在一些视频编辑和处理操作会使得逐行内容的隔行重放对场序敏感。

[0032] 电影胶片(24帧/秒)、PAL(25帧/秒)和NTSC(29.97帧/秒)之间的帧率转换可能涉及从原始序列中增加或去除场。在帧内插入或删除场导致后续的帧由来自不同时间间隔的场组成，从而使得隔行显示对于场序敏感。当将例如剪切和渐变的场级别编辑应用于逐行内容时，也可能引入这样的场序敏感性。

[0033] 图7示出了场失准(field-misalignment)的逐行内容的帧结构。这里将逐行内容分离为若干个场，而将匹配的逐行场置于独立的帧中。该分离要求TFF隔行重放，而不正确的BFF重放可能导致可见的运动抖动。由于要求TFF隔行重放以避免出现问题，因此该问题称为TFF场失准。

[0034] 图8例示了BFF场失准的逐行重复帧内容。在该情况下，TFF隔行重放可能基于运动抖动。

[0035] 在图9中例示了在真实卡通内容中观察到的场失准逐行内容的另一个示例。这里，在本质上帧重复显著且逐行的卡通内容在帧4中具有BFF场失准，结果，在内容中存在不等数量的匹配顶场和底场。这种内容的TFF隔行显示将在该转换处出现运动不连续性，如果该运动不连续性频繁出现就可能被察觉到。

[0036] 除了更持久的运动抖动之外，这种场级别转换也可能导致在场景剪切处出现可见的问题。对于图9中示出的示例，如果场T1/B1和T2/B2属于场景1(灰色)并且T3/B3超前于场景2(白色)，则序列的TFF和BFF显示将得到如图10中所示的场序列。TFF隔行重放将导致场景改变的不连续性，从而会在来自场景1的两个场之间播放来自场景2的场。

[0037] 3.场序分析算法

[0038] 以下描述一种用于检测隔行显示的视频内容中潜在的可见场序问题的技术。该技术对以像素强度表示的场序列或帧序列进行操作，并依赖于来自3个连续帧的场之间的滑动比较。图11示出了对提出的处理的表示，其接受视频内容帧并输出场序错误标记wEFlag、内容决策标记wOFlag和即时决策标记iOFlag。

[0039] 该技术由处理“即时”(高亮灰色)和“加窗”参数集的两个主处理路径构成。该装置包括两个缓存区Dif_buf和IDFlag_buf以及十个功能单元Func1、Func2等。如果需要则可以将其构造为独立的程序控制处理器，或者如果愿意的话，可以通过单个处理器来执行两个或更多个单元的功能。下面描述每个单元的功能。

[0040] 3.1Func1-场差分测量

[0041] 可以将各输入视频帧video(n)视为由一对隔行的顶场T(n)和底场B(n)构成。对于各帧，进行三个差分计算，来表示一种类型的目标场(其是当前帧的顶场或底场)与三个第二类型的目标场(或者相反，前一帧、当前帧和下一帧的场)之间的匹配。在图12中例示了底场目标的处理。

[0042] 使用像素强度值之差的绝对值的均值，可以将差分计算定义为：

[0043]

[0044]

[0045]

[0046] 在(3.1)到(3.3)中，B(n，x，y)表示第n帧的底场中水平方向像素位置x和垂直方向像素位置y处的像素强度值，X和Y分别是水平方向和垂直方向的像素总数。T(n，x，y)表示对应顶场中的相同像素位置。

[0047] 注意，式3.1、3.2和3.3表示的差分信号是在垂直方向上必须彼此之间具有空间偏移(因此即使在没有运动的情况下也会引起非零差分值)的两个场之间的差分。我们尚未发现这在实际中是个严重问题，但是可以通过应用其中一种用于减轻该问题的已有技术来提高可靠性。在对场进行匹配时通过例如“去除核心部分(coring)”和“菱形运动分析”[2..9]的方法来拒绝隔行空间伪影(artefact)的技术特别有利。在另一种方式中，可以忽略(即，在求和之前)小于阈值(threshold)的各差分值，和/或对一个像素与在另一个场上位于该像素之上的线上以及位于该像素之下的线上的对应像素之间的差分都进行求值，并取这两个值中的较小值。

[0048] 以下引用的结果使用了这两种手段，式3.1由下式替换

[0049]

[0050]

[0051] 类似地，对式3.2和3.3：

[0052]

[0053]

[0054]

[0055]

[0056] 这些补偿式用在以下报告的检验中。

[0057] 如果选择顶场作为目标，则除了“T”和“B”转置之外这些公式是相同的。

[0058] 在本说明书中，即使特定编码方案可能使发送顺序发生改变，对“前一帧”、“下一帧”、“后一帧”等的引用也指代按照捕获并显示的顺序所考虑的帧。

[0059] 3.2Func2-加窗场差分测量

[0060] 然后使该组3个差分值DIF1...3(n)进入差分缓存区，在该差分缓存区中还存储有前K-1组差分值。Func2然后根据式(3.4)到(3.6)执行差分参数的时间平均。

[0061]

[0062]

[0063]

[0064] 3.3Func3-加窗决策参数

[0065] 对于各帧，按照大小wRank1...wRank3的顺序对平均差分值wDIF1...3进行排序，使得wRank1等于最大值，而wRank3等于最小值。将变量wIndex1...wIndex3设定为对应索引号，使得如果wDIF2是最大值并且wDIF1是最小值，则wIndex1等于2，wIndex2等于3，而wIndex3等于1。然后根据式(3.7)到(3.9)计算加窗决策参数

[0066] wMotionFlag(n)＝((wRank1(n)-wRank3(n)＞MThresh1) (3.7)[0067] AND(wRank1(n)＞MThresh2))

[0068] wParam1(n) ＝ 100.0*(wRank2(n)-wRank3(n))/(wRank1(n)-wRank3(n)) (3.8)

[0069] wParam2(n)＝100.0*wRank3(n)/wRank2(n) (3.9)

[0070] 在表3.15中给出了MThresh1和MThresh2的可能设定。

[0071] 运动参数wMotionFlag表示对要做出的有意义的场序决策而言存在足够的运动。该参数取决于根据公式(3.7)而将绝对和相对DIF值与适当阈值的比较。参数wParam1表示作为DIF值范围百分比的在排第2和第3的DIF值之间的差分，其旨在反映几乎相同并且显著小于剩余值的两个DIF值的特征。该参数完全基于差分，并且不受对全部3个差分值同等地应用的偏移影响。参数wParam2表示作为百分比并且是最小DIF值与中间DIF值的比率，旨在反映两个最小DIF值之间的差分的整体意义。

[0072] 3.4Func4-加窗决策中间标记

[0073] 通过根据式(3.10)和(3.11)而对wParam1和wParam2相对于阈值进行检验来作出关于第n帧的隔行场序属性的决策。

[0074] wIFlag1(n)＝((wParam1(n)＜iThresh1)AND(wParam2(n)＞iThresh2)[0075] (3.10)[0076] AND(wMotionFlag(n)))

[0077] wIFlag 2(n)＝wIndex1 (3.11)

[0078] 在表3.15中给出了合适的阈值，并且可以根据表3.1来解释所得到的标记。

[0079]wIFlag1 wIFlag2 内容类型检验条件
真 1 TFF隔行 (DIF2≈DIF3)＜DIF1
真 2 隔行错误 (DIF1≈DIF3)＜DIF2
真 3 BFF隔行 (DIF1≈DIF2)＜DIF3
假 - 未知/低运动上述条件均不满足/低运动

[0080] 表3.1隔行决策的说明

[0081] 可以通过根据式(3.12)和(3.13)对wParam1和wParam2相对于阈值进行检验以作出关于第n帧的逐行场序属性的决策。

[0082] wPFlag 1(n)＝((wParam1(n)＞pThresh1)AND (3.12)

[0083] (wParam2(n)＜pThresh2)AND(wMotionFlag(n))

[0084] wPFlag2(n)＝wIndex3 (3.13)

[0085] 根据表3.2设定决策阈值pThresh1，并且定义wParam1参数的接受带。在表3.15中给出了合适阈值。

[0086]wPFlag2 内容类型 pThresh1
1 BFF失准逐行 pThresh1a
2 正确对准逐行 pThresh1b
3 TFF失准逐行 pThresh1a

[0087] 表3.2逐行决策阈值

[0088] 可以根据表3.3来解释所得到的标记。

[0089]wPFlag1 wPFlag2 内容类型检验条件
真 1 BFF失准逐行 (DIF1≈0)＜＜DIF2＜DIF3
真 2 正确对准逐行 (DIF2≈0)＜＜(DIF1≈DIF3)
真 3 TFF失准逐行 (DIF3≈0)＜＜DIF2＜DIF1
假 - 未知/低运动上述条件均不满足/低运动

[0090] 表3.3逐行决策的说明

[0091] 对隔行和逐行决策设定的阈值确保了I和P为“真”的决策互斥。

[0092] 3.5Func5-加窗决策标记

[0093] 然后根据表3.4来组合中间决策标记以给出单个“加窗”决策标记wDFlag。注意，在这里，并且在用于定义该算法的其他表中，在右手栏中示出了运算结果。将仅为说明性的表记为“对...的说明”。

[0094]wIFlag1 wIFlag2 wPFlag1 wPFlag2 wDFlag
真 1 假 - 0＝TFF隔行
真 2 假 - 1＝隔行错误
真 3 假 - 2＝BFF隔行
假 - 真 1 3＝BFF失准逐行
假 - 真 2 4＝正确对准逐行
假 - 真 3 5＝TFF失准逐行
假 - 假 - 6＝未知/低运动
真 - 真 - 错误

[0095] 表3.4组合的隔行/逐行决策标记

[0096] 3.6Func3a-即时参数(iParam1，iParam2)

[0097] Func3a使用3.3节中描述的排序处理而从差分值DIF1(n)...DIF3(n)产生“即时”排序参数，iRank1...3和iIndex1...3。根据式(3.14)和(3.16)计算所得到的“即时”参数值iParam1和iParam2。

[0098] iMotionFlag(n)＝((iRank1(n)-iRank3(n)＞MThresh1) (3.14)[0099] AND(iRank1(n)＞MThresh2))

[0100] iParam1(n) ＝ 100.0*(iRank2(n)-iRank3(n))/(iRank1(n)-iRank3(n)) (3.15)

[0101] iParam2(n)＝100.0*iRank3(n)/iRank2(n) (3.16)

[0102] 3.7Func4a-“即时”决策中间标记

[0103] 可以通过根据式(3.17)和(3.18)对iParam1和iParam2相对于阈值进行检验以作出关于帧n的隔行场序属性的决策。

[0104] iIFlag1(n) ＝ ((iParam1(n) ＜ iThresh1)AND(iParam2(n) ＞ iThresh2) (3.17)

[0105] AND(iMotionFlag(n)))

[0106] iIFlag2(n)＝iIndex1 (3.18)

[0107] 可以根据表3.5来解释所得到的标记。

[0108]iIFlag1 iIFlag2 内容类型检验条件
真 1 TFF隔行 (DIF2≈DIF3)＜DIF1
真 2 隔行错误 (DIF1≈DIF3)＜DIF2
真 3 BFF隔行 (DIF1≈DIF2)＜DIF3
假 - 未知/低运动上述条件均不满足/低运动

[0109] 表3.5对“即时”隔行决策的说明

[0110] 可以根据公式(3.19)和(3.20)对iParam1和iParam2相对于阈值进行检验以作出关于帧n的逐行场序属性的决策。

[0111] iPFlag1(n)＝((iParam1(n)＞pThresh1)AND (3.19)

[0112] (iParam2(n)＜pThresh2)AND(iMotionFlag(n))

[0113] iPFlag2(n)＝iIndex3 (3.20)

[0114] 根据表3.2来设定决策阈值pThresh1，并定义iParam1参数的接受带。可以根据表3.6来解释所得到的标记。

[0115]iPFlag1 iPFlag2 内容类型检验条件
真 1 BFF失准逐行 (DIF1≈0)＜＜DIF2＜DIF3
真 2 正确对准逐行 (DIF2≈0)＜＜(DIF1≈DIF3)
真 3 TFF失准逐行 (DIF3≈0)＜＜DIF2＜DIF1
假 - 未知/低运动上述条件均不满足/低运动

[0116] 表3.6对“即时”逐行决策的说明。

[0117] 对隔行和逐行决策而设定的阈值确保了I和P为“真”的决策互斥，在下表3.15中给出了示例值。

[0118] 3.8Func5a-即时决策标记(iDFlag)

[0119] 根据表3.7来组合“即时”中间决策标记以给出单个“即时”决策标记iDFlag。

[0120]iIFlag1 iIFlag2 iPFlag1 iPFlag2 iDFlag
真 1 假 - 3＝TFF隔行
真 2 假 - 4＝隔行错误
真 3 假 - 5＝BFF隔行
假 - 真 1 0＝BFF失准逐行
假 - 真 2 1＝正确对准逐行
假 - 真 3 2＝TFF失准逐行
假 - 假 - 6＝未知/低运动
真 - 真 - 错误

[0121] 表3.7组合的隔行/逐行决策标记

[0122] 使第n帧的即时决策标记iDFlag(n)进入“即时标记缓存区”iDFlag_buf，在其中将其与根据公式(3.21)和(3.22)的前K-1个即时标记值一起存储。

[0123] iDFlag_buf(k)＝iDFlag_buf(k-1) k＝K...2 (3.21)

[0124] iDFlag_buf(1)＝iDFlag(n) (3.22)

[0125] 3.9Func5b-累计决策标记(Tally Decision Flag，tDFlag)和即时输出标记(Instant Output Flag，iOFlag)

[0126] 在Func5b中对存储在“即时标记缓存区”iDFlag_buf中的K个最新即时标记值进行处理以产生累计标记tDFlag。首先，对标记缓存区进行分析以找到在即时缓存区iDFlag_buf中各可能的iDFlag值(0...6)出现多少次。这根据式(3.23)执行。

[0127]

[0128] 在式(3.24)中定义运算符f1

[0129] f1(k，i)＝1 if(k＝i) (3.24)

[0130] f1(k，i)＝0 else

[0131] 产生一组七个累计计数，如表3.8所示。

[0132]iDFlag 累计
0＝BFF失准逐行 Tally(0)
1＝正确对准逐行 Tally(1)
2＝TFF失准逐行 Tally(2)
3＝BFF隔行 Tally(3)
4＝隔行错误 Tally(4)
5＝TFF隔行 Tally(5)
6＝未知/低运动 Tally(6)

[0133] 表3.8对即时累计结果的说明

[0134] 然后，对与“已知”状态对应的六个即时累计计数进行分析以找到标记值tallyMax，其累计值是这六个值中的最大值且大于决策阈值TyThresh1。表3.9描述了该处理。

[0135]条件 tallyMax
(tally(k)＞tally(i))AND(tally(k)＞TyThresh1)，i≠k，0≤i≤5 kElse 6

[0136] 表3.9TallyMax条件

[0137] 然后根据表3.10设定即时累计标记tDFlag。当对应累计值大于决策阈值TyThresh1时，该标记仅将索引返回“已知”场序条件(0≤iDFlag≤5)，并且在缓存区中没有其他“已知”或“错误”条件。

[0138]条件 tDFlag
tally(tallyMax)+tally(6)＝K tallyMax
Else 6

[0139] 表3.10累计决策标记(tDFlag)

[0140] Func5b还包括“即时间断性”分析，这是用于在逐行内容中检测间断性场失准的过程。首先，根据表3.11确定将潜在地给出可见错误的逐行状态TestFlag，在表3.11中IDFO(隔行显示场序，Interlaced Display FieldOrdering)标记表示隔行显示是TFF还是BFF。IDFO标记表示了假定的或宣称的场的时间关系可以从输入信号得到，或者可以由用户人工输入。

[0141]IDFO TestFlag
TFF 0＝BFF失准逐行
BFF 2＝TFF失准逐行

[0142] 表3.11逐行失准检验标记(TestFlag)

[0143] 如果IDFO表示了TFF，则BFF失准逐行内容可能产生可见运动失真，并将TestFlag设定为0(BFF)。如果IDFO表示了BFF，则将TestFlag设定为2(TFF)。然后将TestFlag用于检验在即时标记缓存区中已经是否检测到大量潜在的可见场失准。根据表3.12来设定所得到的即时输出标记iOFlag。阈值参见表3.15。

[0144]条件 iOFlag
Tally(TestFlag)＞TyThresh2 TestFlag
Else 6

[0145] 表3.12即时输出错误标记(iOFlag)

[0146] 3.10Func5c-加窗输出标记(wOFlag，wEFlag)

[0147] 对于给定的帧缓存区，“即时累计标记”tDFlag反映了大多数“即时”决策值具有相同“已知”条件而所有其他决策值具有“未知”条件的情况。根据表3.13将标记tDFlag与加窗决策标记wDFlag组合起来，以生成总决策标记wOFlag。如果即时累计标记相同，则这有效地将wDFlag的值复制到wOFlag，否则设定“未知”条件。

[0148]wDFlag tDFlag wOFlag
0-6 wDflag wDFlag
0-6 ≠wDFlag 6(未知)

[0149] 表3.13wDFlag和tDFlag的组合

[0150] 输出决策wOFlag表示帧属性(隔行或逐行)和所缓存的内容段的场序属性。应用进一步处理以通过错误标记wEFlag表示所检测到的属性是否会导致隔行显示的可见错误。该功能要求附加输入IDFO(隔行显示场序)，并且在表3.14中进行了定义。应当注意的是，不将TFF隔行显示的TFF失准逐行内容输出标记为错误，也不将BFF显示的BFF失准逐行内容输出标记为错误。

[0151]wOFlag IDFO wEFlag
0＝BFF失准逐行 TFF 1-错误
1＝正确对准逐行 TFF 0-没有错误
2＝TFF失准逐行 TFF 0-没有错误
3＝BFF隔行 TFF 1-错误
4＝隔行错误 TFF 1-错误
5＝TFF隔行 TFF 0-没有错误
0＝BFF失准逐行 BFF 0-没有错误
1＝正确对准逐行 BFF 0-没有错误
2＝TFF失准逐行 BFF 1-错误
3＝BFF隔行 BFF 0-没有错误
4＝隔行错误 BFF 1-错误
5＝TFF隔行 BFF 1-错误
6＝未知 BFF/TFF 0-没有错误

[0152] 表3.14错误标记wEFlag

[0153] 3.11输出标记参数(wOFlag，wEFlag，iOFlag)

[0154] 输出标记wEFlag和wOFlag反映了对场序属性进行加窗分析的结果。在许多帧上对参数进行平均，并通过来自相同时段上逐帧“即时”结果的结果来改进(refine)这些参数。这样，该分析对于重复的场序条件敏感，并且可以被认为是对一般内容属性的可靠检测器。

[0155] 输出标记iOFlag仅基于对逐帧“即时”属性的分析，并且对间断性逐行场失准敏感。该标记所应对的事件不可能通过加窗分析而检测到，因此该分析对潜在的可见错误给出了附加警告。然而，“即时”检验在本质上更容易受错误检测的影响，并且应当被认为是对更可靠的加窗结果的补充警告标记。

[0156] 可能必须对这些标记进行进一步统计分析以满足不同应用的要求。

[0157] 3.12设定和阈值

[0158] 决策阈值的选择取决于该场序分析算法的预期用途。表3.15示出了适于对标准分辨率电视系统检测潜在场序问题的一组阈值。

[0159]名称值注释
K 20 缓存区长度(帧)
TyThresh1 4 累计检测阈值
MThresh1 0.02 运动阈值
MThresh2 0.02 运动阈值
TyThresh2 3 即时标记的累计检测阈值
iThresh1 15.0 最大阈值(第2-min/max-min)
iThresh2 70.0 最小阈值(min/第2)
pThresh1b 80.0 最大阈值2(第2-min/max-min)
pThresh1a 25.0 最小阈值1(第2-min/max-min)
pThresh2 10.0 最大阈值(min/第2)

[0160] 表3.15标准分辨率电视的设定和阈值

[0161] 4算法功能和性能

[0162] 以下考虑第3节中描述的场检测算法的主要方面的功能和性能。首先，在4.1和4.2节中考虑隔行和非重复帧逐行视频的“即时”和“加窗”决策参数的属性。然后在4.3节中，给出将“即时”和“加窗”参数组合起来的优点。

[0163] 4.1隔行视频的决策参数属性

[0164] 对图12考虑隔行内容，B(n)的期望时间位置对于BFF在T(n-1)与T(n)之间，而对于TFF在T(n)与T(n+1)之间。如果在场之间有显著运动，则可以通过逐帧比较Func1产生的DIF值来确定场序。表4.1示出了TFF和BFF隔行视频的期望DIF值。

[0165]场序条件
TFF (DIF2≈DIF3)＜DIF1
BFF (DIF1≈DIF2)＜DIF3

[0166] 表4.1隔行内容的期望DIF条件

[0167] 根据Func1计算7个第2TFF隔行序列的连续帧的DIF值，并且在图13中示出。可以看出，这些“即时”帧值广泛满足TFF检验条件。

[0168] 可以通过时间平均来解决参数的有噪声本质，图14示出了根据Func2应用的滑动20帧窗平均的来自图13的内容。

[0169] 分别在图15和16中与对应隔行决策阈值iThresh1和iThresh2一起示出了根据func3和Func3a计算出的相应“即时”和“加窗”决策参数。

[0170] 参数1旨在反映几乎相同并且显著小于剩余值的两个DIF值的特征，参数2旨在反映最大和最小DIF值之差的总显著性(overall significance)。通过(Func4)和(Func4a)对Param1和Param2相对于阈值进行检验，作出第n帧的隔行类型的“即时”和“加窗”决策。隔行类型的成功检测要求Parameter1低于iThresh1并且Parameter2大于iThresh2。从这些曲线可以看出，“加窗”(特别是对Parameter1)的优点是明显的。

[0171] 4.2逐行内容(非重复帧)的决策参数属性

[0172] 针对没有重复帧的逐行内容考虑图12，场B(n)应当与T(n)在时间上对准。然而，编辑/处理可能使得场B(n)与T(n-1)对准(BFF失准)或与T(n+1)对准(TFF失准)。如针对隔行内容提出的，如果在连续帧之间有显著运动，则可以通过使用相同的DIF值比较来确定场对准。对于这样的逐行内容，表4.2示出了逐行对准的期望DIF条件。

[0173]B(n)对准检验注释
T(n-1) (DIF1≈0)＜＜DIF2＜DIF3 BFF失准
T(n) (DIF2≈0)＜＜(DIF1≈DIF3) 正确对准
T(n+1) (DIF3≈0)＜＜DIF2＜DIF1 TFF失准

[0174] 表4.2逐行内容的期望条件

[0175] 图17示出了呈现期望条件(DIF2≈0)＜＜(DIF1≈DIF3)的8秒正确对准逐行内容的“加窗”DIF值。图18示出了TFF失准逐行内容的“加窗”DIF值，其中(DIF3≈0)＜＜DIF2＜DIF1。

[0176] 在19和20中分别示出了图17和18的对应加窗参数值wParam1和wParam2。

[0177] 对于在帧之间具有显著运动的逐行内容，wParam2≈0的值清楚地将正确和错误对准的内容与隔行内容区分开。对于正确对准的逐行内容，由于排第一和排第二的差分值间隔很小，因此期望wParam1的值接近100％。然而，对于失准逐行内容，该特征不存在，期望范围wParam1＞25％可以用来向区分提供附加置信度。

[0178] 4.3组合“即时”和“加窗”参数

[0179] 隔行和非重复帧逐行视频的“加窗”决策参数一般很稳定，从而能够可靠地识别场序属性。然而，包括场景剪切、快速渐变和快速摇摄的事件可能产生使得“加窗”参数在时间上不可靠的即时DIF值。

[0180] 图21示出了在帧35周围具有场景剪切的TFF隔行序列的DIF参数。图22示出了等效的“即时”参数值，图23是“加窗”参数。

[0181] 该内容的关键特征是帧35处的场景剪切，其导致了DIF1和DIF3测量中的显著峰值。在场景剪切之前是从帧21起的低运动和运动减少时段，这是由在图21中都接近0的三个DIF值反映出来。

[0182] 帧27到31的低运动不能设定式3.14中的“即时”运动标记，并且是通过在图22中两个“即时”决策参数都趋近于零来表示。例如这还出现在帧34、67、88、89处以及帧97以后。场景剪切的特点是进行“即时”分析后针对作为该剪切的一部分的那些帧返回的是“未知”分类而不是“已知的”错误分类。在图22中可以观察到该短时效果。然而，除了针对场景剪切和低运动帧以外，图22还示出了对TFF隔行内容的相当好的“即时”分类。

[0183] 在图23中清楚地示出了“加窗”的优点，TFF分类直到帧32和超过帧53是可靠和稳定的。然而，从帧33到52缺点很清楚，其中场景剪切处的相对大的DIF值在该窗的20帧时长期间具有失真的“加窗”参数。表4.3对此详细示出，且并排示出了“即时”和“加窗”DIF值。

[0184]帧 DIF1 DIF2 DIF3 wDIF1 wDIF2 wDIF3 tDFlag wDFlag wOFlag
31 0.016 0.009 0.011 0.52 0.072 0.074 5 5 5
32 0.013 0.01 0.012 0.44 0.059 0.062 5 5 5
33 0.022 0.01 0.032 0.364 0.046 0.049 5 5 5
34 0.083 0.02 28.164 0.296 0.036 1.448 5 6 6
35 30.989 0.003 0.017 1.783 0.028 1.44 6 1 6
36 0.38 0.042 0.055 1.749 0.023 1.437 6 1 6
37 0.608 0.067 0.117 1.734 0.022 1.439 6 1 6
38 0.825 0.164 0.184 1.74 0.027 1.445 6 1 6
39 1.116 0.175 0.214 1.772 0.034 1.453 6 1 6
40 1.26 0.204 0.223 1.816 0.042 1.462 5 1 6
41 1.255 0.169 0.135 1.865 0.05 1.467 5 1 6[0185] 表4.3TFF隔行场景剪切的帧值

[0186] 表4.3还示出了场景剪切不仅使得后面的“加窗”DIF值失真，而且导致“加窗”决策wDFlag针对帧35以后返回了“1＝正确对准逐行”的错误分类。

[0187] 第3节中描述的场序分类方法通过组合“即时”和“加窗”技术来解决场景剪切的问题(更一般地是高运动渐变和摇摄)。“即时”参数本质上更多变，但是与“加窗”参数相比对这样的条件更稳健。表4.3示出了组合决策wOFlag拒绝了“加窗”分析wDFlag的错误分类。

[0188] 对二十分钟TFF隔行标准分辨率电视进行了分析，并在图24中给出了“加窗”和“组合”分类结果。可以看到，通过“组合”分析除去了“加窗”分析对逐行的少部分错误分类。

[0189] 4.4重复帧逐行内容

[0190] 具有重复帧的逐行内容(图4)存在的特别问题是所检验的各底场可能与至少两个顶场在时间上完全对准。图25示出了正确对准的2x重复帧逐行内容的“即时”DIF值。由于所检验的各底场与对应顶场(或者前一顶场及下一顶场)在时间上对准，因此DIF2恒定地接近零，并且DIF1和DIF3在本质上是锯齿形的。

[0191] 图26示出了BFF失准2x重复帧内容的即时DIF值(图8)。这里，对于每个帧DIF1≈0并且DIF1＜＜DIF3，对于交替帧DIF2≈DIF1并且DIF2≈DIF3。

[0192] 这样的规则帧重复要求对第3节中描述的“加窗”分析进行修改，这是因为根据式3.4到3.6对图25和26中所示的DIF值进行时间平均将会是不明智的(sensible)。如果保证重复帧在本质上是规则的和一致的，则可以在“加窗”分析之前包含例如中值光滑的技术。然而，已经发现在随机的场失准的情况下卡通内容经常具有时变的重复帧属性。

[0193] 第3节中描述的技术旨在仅识别潜在的可见失准，而不是试图对这种内容的所有区域进行分类。通过在“即时”标记缓存区中搜索潜在的有问题模式而在Func5b内实现了这一点。该技术得益于对逐行内容进行“即时”决策的高可靠性。

[0194] 针对目标TFF显示而分析了具有可变重复帧和BFF失准的十分钟标准分辨率逐行卡通内容。图27示出了组合分析wOFlag和“即时间断性”分析iOFlag的分类结果。可以看到，“即时间断性”检验显著增加了算法对不规则的有问题场失准的灵敏度。这一能力对处理变化程度的重复帧特别有用，而变化程度的重复帧是“加窗”分析不能很好地处理的情况。

[0195] 5.结论

[0196] 已经将这里描述的技术设计为针对逐行和隔行内容的隔行显示来识别潜在的场序问题。使用滑动的3帧分析窗来生成用于得到对应“即时”和“加窗”决策参数的“即时”场差分测量集合和“加窗”场差分测量集合。将这些参数设计为反映逐行和隔行视频序列的场序的关键识别特征。已经示出了“加窗”和“即时”分析的组合提供了既能应对隔行序列又能应对逐行序列的可靠分类技术。“组合”分析使得该技术对在场景剪切、高运动摇摄和渐变、或者在重复帧逐行内容的情况下的错误分类特别稳健。而且，针对不规则或间断性问题而将仅“即时”检验包括进来增强了对重复帧逐行内容中的潜在问题的识别。

[0197] 6.参考文献

[0198] ITU-R Rec.BT.601，″Studio encoding parameters of digitaltelevision for standard 4：3 and wide screen 16：9 aspect ratios，″http://www.itu.int/rec/R-REC-BT.601/en.

[0199] Kahn and Sanders， ″ Detection of progressive frames in a video thfieldsequence，″US Patent 6563550，May 13 2003.

[0200] Casavant，Hurst，Perlman，Isnardi and Aschwanden， ″ Video/film-mode detector using patterns of 2-field differences″，US Patent5317398，May 1994.[0201] Westerman and Modem，″System for identifying video fieldsgenerated from film sources，″US Patent 6157412，Dec 2000.

[0202] Honda and Nagakubo，″Method for identifying input video signaland processing the video signal，″US Patent 6154257，Nov 2000.

[0203] Swartz，″Film source video detection，″US Patent 6014182，Jan2000.[0204] Selby，″Method and apparatus for detecting motion between odd andeven fields，″US Patent 6633612，Oct 2003.

[0205] Faroudja，Xu and Swartz， ″ Motion detection between even and odd fieldswithin 2：1 interlaced television standard，″US Patent 5291280，March1994.

[0206] Christopher and Correa，″Method and Aparatus for Identifying..，″US Patent 5689301，Nov 1997.

视频信号分析转让专利

申请号 : CN200880015053.3

文献号 : CN101690177B

文献日 : 2012-02-15

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 安德鲁·戈登·戴维斯

申请人 : 英国电讯有限公司

摘要 :

权利要求 :

说明书 :

视频信号分析