以支持辅助帧的视频编码格式编码视频流的方法及编码器转让专利

申请号 : CN201811197067.3

文献号 : CN109688410B

文献日 : 2021-01-29

相似专利: 请登录后查看

一种以支持辅助帧的视频编码格式编码视频流的方法及编码器。本发明涉及视频编码领域。尤其是，它涉及一种以支持辅助帧的视频编码格式编码视频流的方法及编码器，其中此类辅助帧结合引用所述辅助帧的帧，能够用于码率控制，因为所述辅助帧的图像数据包括由视频捕获设备捕获的图像数据的按比例缩小版本，且计算并确定引用所述辅助帧的帧的移动矢量，以对所述图像数据的按比例缩小版本进行按比例放大，从而再次具有预期分辨率。

1.一种以视频编码格式编码视频流的方法，其中所述视频编码格式支持将辅助帧纳入编码的视频流，所述辅助帧被所述编码的视频流中的另一帧引用，并且所述辅助帧包括对所述编码的视频流中的另一帧进行补充的图像数据，所述辅助帧包括标记值，所述标记值指示：不旨在当对所述编码的视频流进行解码时显示所述辅助帧的图像数据、而是将所述辅助帧的图像数据用于与所述另一帧的数据结合以获得要显示的图像数据，所述方法包括：接收由视频捕获设备捕获的第一图像数据;

确定解码时所述视频流的预期分辨率；

对所述第一图像数据进行按比例缩小，以获取按比例缩小的第一图像数据，其中所述按比例缩小的第一图像数据具有低于所述预期分辨率的第一分辨率；

准备空的第一辅助帧，其中所述第一辅助帧的图像数据具有等于所述预期分辨率的分辨率，并包括全都具有同一预定义值的比特；

将所述按比例缩小的第一图像数据粘贴到所述第一辅助帧的图像数据；

将所述第一辅助帧编码为帧内帧；

确定第一图像变换，用于将所述第一辅助帧的图像数据中的按比例缩小的第一图像数据按比例放大到具有所述预期分辨率的按比例放大的第一图像数据；

根据至少一个预定的宏块尺寸，通过对所述第一图像变换导致的像素的移动进行采样来确定第一移动矢量；以及将所述第一图像数据编码成作为引用所述第一辅助帧的帧间帧的第一帧，其中所述第一帧的移动矢量与所述第一移动矢量相对应。

2.根据权利要求1所述的方法，进一步包括：

接收由所述视频捕获设备捕获的第二图像数据；

对所述第二图像数据进行按比例缩小，以获得按比例缩小的第二图像数据，其中所述按比例缩小的第二图像数据的分辨率为所述第一分辨率；

准备空的第二辅助帧，其中所述第二辅助帧的图像数据具有等于所述预期分辨率的分辨率；

将所述按比例缩小的第二图像数据粘贴到所述第二辅助帧的图像数据；

将所述第二辅助帧编码为引用所述第一辅助帧的帧间帧；

确定第二图像变换，用于将所述第二辅助帧的图像数据中的所述按比例缩小的第二图像数据按比例放大为具有所述预期分辨率的按比例放大的第二图像数据；

通过对所述第二图像变换进行采样来确定第二移动矢量；并且将所述第二图像数据编码成作为引用所述第二辅助帧的帧间帧的第二帧，其中所述第二帧的移动矢量与第二移动矢量相对应。

3.根据权利要求1所述的方法，进一步包括：

由所述视频捕获设备捕获第三图像数据；

对所述第三图像数据进行按比例缩小，以获得按比例缩小的第三图像数据，其中所述按比例缩小的第三图像数据具有第二分辨率，所述第二分辨率不同于所述第一分辨率并且低于所述预期分辨率；

准备空的第三辅助帧，其中所述第三辅助帧的图像数据具有等于所述预期分辨率的分辨率；

将所述按比例缩小的第三图像数据粘贴到所述第三辅助帧的图像数据；

将所述第三辅助帧编码为帧内帧；

确定第三图像变换，用于将所述第三辅助帧的图像数据中的所述按比例缩小的第三图像数据按比例放大为具有所述预期分辨率的按比例放大的第三图像数据；

通过对所述第三图像变换进行采样来确定第三移动矢量；并且将所述第三图像数据编码成作为引用所述第三辅助帧的帧间帧的第三帧，其中所述第三帧的移动矢量与所述第三移动矢量相对应。

4.根据权利要求1所述的方法，进一步包括：

确定要被以第三分辨率纳入所述编码的视频流的所述第一图像数据的一部分ROI1，所述第三分辨率高于所述第一分辨率；

将具有所述第三分辨率的ROI1粘贴到所述第一辅助帧的图像数据，以使得所述ROI1不会覆写所述按比例缩小的第一图像数据、或变得被所述按比例缩小的第一图像数据覆写，从而使所述ROI1不与所述按比例缩小的第一图像数据重叠；

确定第四图像变换，用于将具有所述预期分辨率的ROI1插入所述按比例放大的第一图像数据；并且通过对所述第四图像变换进行采样来确定第四移动矢量，其中将所述第一图像数据编码成作为帧间帧的所述第一帧的步骤包括：将所述第一帧的移动矢量确定为与所述第一移动矢量和所述第四移动矢量相对应。

5.根据权利要求4所述的方法，进一步包括：

接收由所述视频捕获设备捕获的第二图像数据；

对所述第二图像数据进行按比例缩小，以获得按比例缩小的第二图像数据，其中所述按比例缩小的第二图像数据的分辨率为所述第一分辨率；

准备空的第二辅助帧，其中所述第二辅助帧的图像数据具有等于所述预期分辨率的分辨率；

将所述按比例缩小的第二图像数据粘贴到所述第二辅助帧的图像数据；

将所述第二辅助帧编码为引用所述第一辅助帧的帧间帧；

通过对所述第二图像变换进行采样来确定第二移动矢量；

将所述第二图像数据编码成作为引用所述第二辅助帧的帧间帧的第二帧，其中所述第二帧的移动矢量与所述第二移动矢量相对应；

确定要被以所述第三分辨率纳入所述编码的视频流的所述第二图像数据的一部分ROI2；

将具有所述第三分辨率的所述ROI2粘贴到所述第二辅助帧的图像数据，以使得所述ROI2不会覆写所述按比例缩小的第二图像数据、或变得被所述按比例缩小的第二图像数据覆写；

确定第五图像变换，用于将具有所述预期分辨率的所述ROI2插入所述按比例放大的第二图像数据；并且通过对所述第四图像变换进行采样来确定第五移动矢量，其中将所述第二图像数据编码成作为帧间帧的第二帧的步骤包括：将所述第二帧的移动矢量确定为与所述第二移动矢量和所述第五移动矢量相对应。

6.根据权利要求5的所述方法，其中将所述ROI1和所述ROI2分别在对应的位置上粘贴到所述第一辅助帧和所述第二辅助帧的图像数据。

7.根据权利要求4所述的方法，其中所述第三分辨率为来自以下项的列表中的一个第三分辨率：等于所述预期分辨率的第三分辨率，和大于所述预期分辨率的第三分辨率。

8.根据权利要求1所述的方法，其中所述预期分辨率等于由所述视频捕获设备捕获的图像数据的分辨率。

9.根据权利要求1所述的方法，其中所述视频编码格式为来自以下项的列表中的一个格式：高效图像文件格式、高效视频编码H.265、H.264、VP10、VP9、AV1、高级视频编码和H.266。

10.一种非暂时性计算机可读存储介质，所述非暂时性计算机可读存储介质包括指令，所述指令在由具有处理能力的设备执行时，使所述设备执行用于以视频编码格式对视频流进行编码的指令，其中，所述视频编码格式支持将辅助帧纳入编码的视频流，所述辅助帧被所述编码的视频流中的另一帧引用，并且所述辅助帧包括对所述编码的视频流中的另一帧进行补充的图像数据，所述辅助帧包括标记值，所述标记值指示：不旨在当对编码的视频流进行解码时显示所述辅助帧的图像数据、而是将所述辅助帧的图像数据用于与所述另一帧的数据结合以获取要显示的图像数据，所述指令使所述设备执行包括以下步骤的操作：接收由视频记录设备捕获的第一图像数据；

确定解码时所述视频流的预期分辨率；

对所述第一图像数据进行按比例缩小，以获得按比例缩小的第一图像数据，其中所述按比例缩小的第一图像数据具有低于所述预期分辨率的第一分辨率；

准备空的第一辅助帧，其中所述第一辅助帧的图像数据具有等于所述预期分辨率的分辨率，并包括全都具有同一预定义值的比特；

将所述按比例缩小的第一图像数据粘贴到所述第一辅助帧的图像数据；

将所述第一辅助帧编码为帧内帧；

确定第一图像变换，用于将所述第一辅助帧的图像数据中的所述按比例缩小的第一图像数据按比例放大为具有所述预期分辨率的按比例放大的第一图像数据；

根据至少一个预定的宏块尺寸，通过对所述第一图像变换导致的像素的移动进行采样来确定第一移动矢量；并且将所述第一图像数据编码成作为引用所述第一辅助帧的帧间帧的第一帧，其中所述第一帧的移动矢量与所述第一移动矢量相对应。

11.一种视频流编码器，被配置为以视频编码格式对由视频记录设备捕获的视频流进行编码，其中所述视频编码格式支持将辅助帧纳入编码的视频流，所述辅助帧被所述编码的视频流中的另一帧引用，并且所述辅助帧包括对所述编码的视频流中的另一帧进行补充的图像数据，所述辅助帧包括标记值，所述标记值指示：不旨在当对编码的视频流进行解码时显示所述辅助帧的图像数据、而是将所述辅助帧的图像数据用于与所述另一帧的数据结合以获取要显示的图像数据，其中所述编码器进一步包括处理单元，所述处理单元被配置为执行以下操作：接收由所述视频记录设备捕获的第一图像数据；

确定解码时所述视频流的预期分辨率；

准备空的第一辅助帧，其中所述第一辅助帧的图像数据具有等于所述预期分辨率的分辨率，并包括全都具有采样预定义值的比特；

将所述按比例缩小的第一图像数据粘贴到所述第一辅助帧的图像数据；

将所述第一辅助帧编码为帧内帧；

根据至少一个预定的宏块尺寸，通过对所述第一图像变换导致的像素的移动进行采样来确定第一移动矢量，并且将所述第一图像数据编码成作为引用所述第一辅助帧的帧间帧的第一帧，其中所述第一帧的移动矢量与所述第一移动矢量相对应。

12.一种视频编码和解码系统，包括：

视频流编码器；以及

解码器，其中所述编码器经由数字网络连接到所述解码器；

其中所述视频流编码器被配置为以视频编码格式对由视频记录设备捕获的视频流进行编码，其中所述视频编码格式支持将辅助帧纳入编码的视频流，所述辅助帧被所述编码的视频流中的另一帧引用，并且所述辅助帧包括对所述编码的视频流中的另一帧进行补充的图像数据，所述辅助帧包括标记值，所述标记值指示：不旨在当对编码的视频流进行解码时显示所述辅助帧的图像数据、而是将所述辅助帧的图像数据用于与所述另一帧的数据结合以获取要显示的图像数据，其中所述视频流编码器进一步被配置为：

接收由所述视频记录设备捕获的第一图像数据；

确定解码时所述视频流的预期分辨率；

准备空的第一辅助帧，其中所述第一辅助帧的图像数据具有等于所述预期分辨率的分辨率，并包括全都具有采样预定义值的比特；

将所述按比例缩小的第一图像数据粘贴到所述第一辅助帧的图像数据；

将所述第一辅助帧编码为帧内帧；

根据至少一个预定的宏块尺寸，通过对所述第一图像变换导致的像素的移动进行采样来确定第一移动矢量，并且将所述第一图像数据编码成作为引用所述第一辅助帧的帧间帧的第一帧，其中所述第一帧的移动矢量与所述第一移动矢量相对应；

其中所述解码器被配置为：

对以所述编码器的视频编码格式编码的视频流进行解码，其中所述编码器被适配为：经所述数字网络接收所述预期分辨率；

接收第一分辨率；

根据接收到的所述预期分辨率和接收到的所述第一分辨率对所述视频流进行编码；

经所述数字网络传送所述编码的视频流；

经所述数字网络接收所述编码的视频流；并且

对所述编码的视频流进行解码，以获取解码的视频流。

13.根据权利要求12所述的系统，进一步包括：

显示器；

其中所述编码器进一步被配置为：

确定要被以第三分辨率纳入所述编码的视频流的所述第一图像数据的一部分ROI1，所述第三分辨率高于所述第一分辨率;将具有所述第三分辨率的所述ROI1粘贴到所述第一辅助帧的图像数据，以使得所述ROI1不会覆写所述按比例缩小的第一图像数据、或变得被所述按比例缩小的第一图像数据覆写，从而使所述ROI1不与所述按比例缩小的第一图像数据重叠；

确定第四图像变换，用于将具有所述预期分辨率的所述ROI1插入所述按比例放大的第一图像数据；

通过对所述第四图像变换进行采样来确定第四移动矢量，其中将所述第一图像数据编码到作为帧间帧的所述第一帧包括：将所述第一帧的移动矢量确定为与所述第一移动矢量和所述第四移动矢量相对应；

其中所述解码器进一步被配置为：

对所述编码的视频流进行解码，以获取解码的视频流，其中所述解码包括从所述第一辅助帧的图像数据提取所述ROI1；并且在所述显示器上与所述解码的视频流分离地显示所述ROI1。

14.根据权利要求13所述的系统，其中所述第三分辨率大于所述预期分辨率，其中在所述显示器上与所述解码的视频流分离地显示所述ROI1包括：在所述显示器上以所述第三分辨率显示所述ROI1。

以支持辅助帧的视频编码格式编码视频流的方法及编码器

技术领域

[0001] 本发明涉及视频编码领域。尤其是，它涉及一种以支持辅助帧的视频编码格式编码视频流的方法及编码器。

背景技术

[0002] 过去几年见证了数字及在线视频和他们的应用大受欢迎。经例如互联网的视频流播、直播视频和录制视频，变得比观看诸如电视之类的视频或租DVD的传统方式更为流行。流播视频时可能出现的问题是其上进行流播的互联网连接的带宽对于流播视频的分辨率(HD，4K，1080P等)太低，或是互联网连接的带宽波动。带宽不足可能导致流播视频断断续续，这使得视频因延迟而无法观看。一种在有限带宽的互联网连接上对视频进行流播而准备的方法为码率控制。码率控制在视频编码中起着重要作用，其中码率控制确保编码的比特流能够被成功传输、并充分利用有限带宽。换言之，它根据固定或可变的带宽来调整视频输出比特。通常，码率控制与压缩和帧频一起作用，这在低比特率时往往造成糟糕的质量。

[0003] US2004/120398(Zhang等)公开了一种用于对包含图像序列的视频进行适配性编码的方法，其中各图像为具有两个域的图片。将视频的各图像编码为帧，从编码的帧中提取速率失真特性，同时将视频的各图像并行地编码为两个域，并从域中提取速率失真特性。根据提取的速率失真特性来确定成本函数的参数值λ，并根据提取的速率失真特性和参数λ来构造成本函数。然后，取决于构造的用于图像的成本函数的值，为各图像选择帧编码或域编码。

[0004] US62263276(Igarashi等)公开了一种将表示图片的帧视为由区域构成的编码器。对于各区域，编码器决定基于帧或基于域的正交变换哪一个在减少那一区域的空间冗余方面会最有效。对于各区域，编码器决定基于帧或基于与的预测编码哪个在减少那一区域的时间冗余方面会最有效。编码器使用最有效的正交变换技术、并使用最有效的预测编码技术对图片帧的各区域进行编码，以生成编码的信号。解码器对编码的信号进行解码。编码的信号记录在记录介质上，在传输信道上传送、或广播。

[0005] “用于H.264/AVC的帧内帧的适配性划分预测编码”(Piao等)公开了一种为H.264/AVC的渐进式时序列提出的帧内帧编码策略。在提出的方法中，在水平或垂直方向对每个其它像素进行采样，无任何反混淆过滤，接着生成偶像素和奇像素的两个子帧。分别用帧内及帧间帧编码方法对偶像素及奇像素子帧进行编码。该提出的方法能够扩展到多层情况，其中将偶像素子帧再次细分为偶像素子帧和奇像素子帧，等等，以进一步提高编码效率。

[0006] 因此在这种背景下，有改进的需求。

发明内容

[0007] 鉴于上述情况，因此本申请的目的是克服或至少减轻上面讨论的问题。尤其是，目的是提供一种当需要视频流的捕获帧的复杂变换时减轻视频捕获系统的资源负担、便于检索原始捕获的图像数据的编码方法及编码器。

[0008] 根据本发明的第一方面，提供了一种用于以视频编码格式对视频流进行编码的方法，其中视频编码格式支持将辅助帧纳入编码的视频流，辅助帧被编码的视频流中的另一帧引用，并且该辅助帧包括对编码的视频流中的另一帧进行补充的图像数据，该辅助帧包括标记值，所述标记值指示：不旨在当对编码的视频流进行解码时显示辅助帧的图像数据、而是将所述辅助帧(110)的图像数据用于与所述另一帧的数据结合以用于获取要显示的图像数据。

[0009] 该方法包括步骤：

[0010] -接收由视频捕获设备捕获的第一图像数据

[0011] -确定解码时、用于视频流的预期分辨率，

[0012] -对第一图像数据进行按比例缩小，以获得按比例缩小的第一图像数据，其中按比例缩小的第一图像数据具有低于预期分辨率的第一分辨率，

[0013] -准备空的第一辅助帧，其中第一辅助帧的图像数据具有等于预期分辨率的分辨率，并包括全都具有同一预定义值的比特，

[0014] -将按比例缩小的第一图像数据粘贴到第一辅助帧的图像数据，

[0015] -将第一辅助帧编码为帧内帧，

[0016] -确定第一图像变换，用于将第一辅助帧的图像数据中的按比例缩小的第一图像数据按比例放大到具有预期分辨率的按比例放大的第一图像数据，

[0017] -根据至少一个预定的宏块尺寸，通过对由第一图像变换所导致的像素的移动进行采样来确定第一移动矢量，

[0018] -将第一图像数据编码成作为引用第一辅助帧的帧间帧的第一帧，其中第一帧的移动矢量与第一移动矢量相对应。

[0019] 辅助帧通常意指对编码的视频流中的另一帧(也叫作主图像)进行补充的图像数据的存储。换言之，所述另一帧引用辅助帧。辅助帧能够以各种形式用于辅助显示它所补充的帧，但一般本身不被显示。辅助帧可以称作辅助图形，辅助图像项、非显示的帧、辅助图片等。辅助帧的公知应用包括将它用于提供透明信息的图像平面或深度图。

[0020] 第一帧(以下为第二、第三等)因而也可以叫做主图像或主帧。

[0021] 在此公开文本中，术语“分辨率”通常指图像中的像素数目。分辨率有时用图像的宽及高以及图像中的像素总数来标识。用于分辨率的另一术语为“尺寸”或像素尺寸。

[0022] “预期分辨率”通常意指旨在以例如4K、1080P、720P、DVD、VCD、1920x1080等来显示视频流的分辨率。例如，客户端可以请求某个分辨率(例如1080P)的视频流，或编码器可以以其它方式知晓旨在以哪个分辨率对编码的视频流进行解码，例如编码器中的硬编码值，或基于IP地址或类似于请求的客户端。预期分辨率还可以包括像素总数和长宽比，例如3.6百万像素和16*9。根据一些实施方式，预期分辨率可以基于旨在显示编码的视频流的电子图像设备的像素密度。

[0023] 术语“第一辅助帧的图像数据具有与预期分辨率相对应的分辨率”(用于第二、第三帧等的类似表达)通常意指辅助帧的图像数据的尺寸与具有预期分辨率的图像的尺寸相对应，例如用于1080P的预期分辨率的1920x1080。

[0024] 在例如H.265编码标准(诸如谷歌的VP10指令之类的其它较新的编码标准)内，一个帧能够被标记为“不显示”，意指不向用户显示该帧。在例如H.265中，能够通过将片头中的pic_output_flag设为假或将SEI头中的no_display标记设为真，进行标记。

[0025] 发明人已意识到此类辅助帧连同引用辅助帧的帧能够用于码率控制，因为辅助帧的图像数据包括由视频捕获设备捕获的图像数据的按比例缩小版本，计算/确定引用辅助帧的帧的移动矢量，以对图像数据的按比例缩小版本进行按比例放大，从而再次具有预期分辨率。按比例缩小因子，即第一分辨率，能够被确定为实现编码的视频流的比特尺寸按需缩小。因相较于具有预期分辨率的图像数据、能够使用较少的比特对辅助帧的按比例缩小的图像数据进行编码，所以可以减少用于传输编码的视频流所需的带宽。在此实施方式中，辅助帧的、不包括按比例缩小的图像数据的部分图像数据将为空，因此能用极少的比特编码。例如，将第一辅助帧编码为I-帧的步骤可以包括将第一宏块尺寸用于第一辅助帧的、对包括按比例缩小的第一图像数据的图像数据进行编码，将第二宏块数据用于对第一辅助帧的、不包括按比例缩小的第一图像数据的图像数据进行编码，其中第一宏块尺寸小于第二宏块尺寸。结果，可以提供进一步的实现码率控制的方法。

[0026] 本实施方式可以进一步有利，在于因上面的方法遵循此类视频编码格式的标准，所以支持编码器所用的视频编码格式的标准视频解码器能够对编码的视频流进行解码。而且，用户将受益于能够以标准的兼容方式接收低分辨率的视频流，而不必重启流。

[0027] 根据一些实施方式，该方法进一步包括步骤：

[0028] -接收由视频捕获设备捕获的第二图像数据，

[0029] -对第二图像数据进行按比例缩小，以获得按比例缩小的第二图像数据，其中按比例缩小的第二图像数据的分辨率为第一分辨率，

[0030] -准备空的第二的第二辅助帧，其中第二辅助帧的图像数据具有等于预期分辨率的分辨率，

[0031] -将按比例缩小的第二图像数据粘贴到第二辅助帧的图像数据，

[0032] -将第二辅助帧编码为引用第一辅助帧的帧间帧，

[0033] -确定第二图像变换，用于将第二辅助帧的图像数据中的按比例缩小的第二图像数据按比例放大为具有预期分辨率的按比例放大图像数据，

[0034] -通过对第二图像变换进行采样来确定第二移动矢量，

[0035] -将第二图像数据编码成作为引用第二辅助帧的帧间帧的第二帧，其中第二帧的移动矢量与第二移动矢量相对应。

[0036] 一些视频压缩标准，诸如本文描述的视频编码格式之类，规定了根据例如I-帧的帧内帧和例如P-帧或B-帧的帧间帧所实现的时间视频压缩。帧内帧基本上为仅使用要编码的图像帧中的信息来编码的图像帧。而且，根据捕获的、用于要编码的图像帧的所有图像数据来计算帧内帧。因此，帧内帧有时称作全帧。帧间帧，也称作预测帧或差分帧，基于来自前面(可选地后面)编码的图像帧的信息以及当前编码的帧的信息，即帧间帧可以被描述为利用前面(可选地后面)图像帧中的时间冗余信息。实现此类编解码(压缩标准)的编码器一般生成帧内帧，跟着是预定数目的帧间帧，然后是新的帧内帧，跟着是同样数目的帧间帧。帧内帧、跟着是若干帧间帧的这一序列的长度通常称作图片组长度(GOP长度)。对于一些压缩标准，例如H.265，编码期间能够对GOP长度进行调整。

[0037] 使用当前实施方式，第二辅助帧的编码利用时间视频压缩。第二辅助帧的编码因而利用之前的第一辅助帧中的时间冗余信息。编码的第二辅助帧因而可以包含与第一辅助帧的图像数据相关的第二图像数据的移动矢量偏移和描述第一辅助帧中不存在的图像内容和预测误差(也称作余值)的图像数据。

[0038] 应该注意到可以以迭代方式执行上面公开的实施方式，意指根据定义的GOP长度，它可以重复用于由视频捕获设备捕获的第三、第四图像数据等。此后，可以启动帧内帧、跟着是若干帧间帧的新序列。结果，根据一些实施方式，该方法进一步包括步骤：

[0039] -由视频记录设备捕获第三图像数据，

[0040] -对第三数据进行按比例缩小，以获得按比例缩小的第三图像数据，其中按比例缩小的第三图像数据具有第二分辨率，第二分辨率不同于第一分辨率并且且低于预期分辨率，

[0041] -准备空的第三辅助帧，其中第三辅助帧的图像数据具有等于预期分辨率的分辨率，

[0042] -将按比例缩小的第三图像数据粘贴到第三辅助帧的图像数据，

[0043] -将第三辅助帧编码为帧内帧，

[0044] -确定第三图像变换，用于将第三辅助帧的图像数据中的按比例缩小的第三图像数据按比例放大为具有预期分辨率的按比例放大的第三图像数据

[0045] -通过对第三图像变换进行采样来确定第三移动矢量，

[0046] -将第三图像数据编码成作为引用第三辅助帧的帧间帧的第三帧，其中第三帧的移动矢量与第三移动矢量相对应。

[0047] 在启动新GOP的情况下改变帧上的按比例缩小因子(第二分辨率不同于第一分辨率)，产生帧间帧编码的辅助帧，可能是有利的，在于根据辅助帧的所有图像数据计算帧间帧，因此不依赖于基于不同的按比例缩小因子(第一分辨率)所编码的前一帧。通过编码期间允许按比例缩小因子改变，编码器能够非常迅速地对关于减小编码的视频流的尺寸的新需求做出反应，例如可用带宽的变化，从而提供改进的码率控制。根据一些实施方式，GOP长度也在编码期间变化，以使得编码器能够更快地适应新需求。

[0048] 根据一些实施方式，该方法进一步包括步骤：

[0049] -确定要被以第三分辨率纳入编码的视频流的第一图像数据的一部分ROI1，第三分辨率高于第一分辨率

[0050] -将具有第三分辨率的ROI1粘贴到第一辅助帧的图像数据，以使得ROI1不会覆写按比例缩小的第一图像数据，或变得被按比例缩小的第一图像数据覆写，从而使ROI1不与按比例缩小的第一图像数据重叠，

[0051] -确定第四图像变换，用于将具有期望分辨率的ROI1插入第一升格图像数据，[0052] -通过对第四图像变换进行采样来确定第四移动矢量，

[0053] 其中，将第一图像数据编码成作为帧间帧的第一帧的步骤包括：将第一帧的移动矢量确定为与第一移动矢量和第四移动矢量相对应。

[0054] 在此实施方式中，第一辅助帧的图像数据的空部分用于提供较高分辨率的图像数据，其对于观看者(或图像分析软件)可能具有特殊兴趣，例如人的脸部或车的牌照。通过重新配置第一帧的移动矢量，对于由视频捕获设备捕获的图像数据的任一指定兴趣区，能够在解码的视频流中实现较高的分辨率。第四移动矢量因此将ROI1映射入第一升格图像数据中的正确位置(与第一图像数据中ROI1的位置相对应)。

[0055] 根据一些实施方式，该方法进一步包括步骤：

[0056] -确定要被以第三分辨率纳入编码的视频流的第二图像数据的一部分ROI2，[0057] -将具有第三分辨率的ROI2粘贴到第二辅助帧的图像数据，以使得ROI2不会覆写按比例缩小的第二图像数据，或变得被按比例缩小的第二图像数据覆写，

[0058] -根据将具有期望分辨率的ROI2插入按比例缩小的第二图像数据，确定第五图像变换，

[0059] -通过对第四图像变换进行采样来确定第五移动矢量，

[0060] 其中将第二图像数据编码成作为帧间帧的第二帧的步骤包括：将第二帧的移动矢量确定为与第二移动矢量和第五移动矢量相对应。

[0061] ROI2一般显示与ROI1相同的主体，从编码角度这可能是有利的，因为第二辅助帧的帧间帧编码是可能更有效的情况。然而，情况并非总是如此。确定为纳入辅助帧中较高分辨率的版本的第一及第二图像数据的部分可以不同，例如在第一辅助帧中显示牌照，在第二辅助帧中显示司机脸部。第五移动矢量因而将ROI2映射入按比例放大的第二图像数据中的正确位置(与第二图像数据中ROI2的位置相对应)。

[0062] 根据一些实施方式，将ROI1和ROI2分别在对应的位置上粘贴到第一及第二辅助帧的图像数据。当对第二辅助帧的图像数据进行帧间帧编码时，从编码的角度这可能是有利的，因为当编码器在前一(第一)辅助帧中搜索较小的宏块时，那么编码器的块匹配算法的搜索窗口可能较小。

[0063] 根据一些实施方式，第三分辨率为来自以下项的列表中的一个第三分辨率：等于期望分辨率的第三分辨率，和大于期望分辨率的第三分辨率。此实施方式可以在解码并显示时增加用于ROI1的细节层次。

[0064] 根据一些实施方式，预期分辨率等于由视频记录设备捕获的图像数据的分辨率。这可以增加编码方法的灵活性，因为按比例缩小因子能够改变，以使得相较于取决于需求、降至高细节损失的捕获的图像数据(低按比例缩小因子)，按比例缩小的图像数据几乎不会带来细节损失。然而，根据一些实施方式，预期分辨率还可以低于由视频记录设备捕获的图像数据的分辨率。

[0065] 根据一些实施方式，视频编码格式为列表之一：高效图像文件格式、高效视频编码H.265、H.264、VP10、VP9、AV1、高级视频编码和H.266。然而，应该注意到本发明涵盖了如本文所述的任意支持辅助帧的视频编码格式。

[0066] 根据一些实施方式，该方法包括基于编码器连接到的数字网络的比特率，确定第一分辨率。例如，编码器和/或码率控制器可以从例如推动传输的视频流的编码器和接收器之间的链路上的持续流量的应用、接收关于比特率的报告，并随着时间过去计算平均值。比特率的另一示例为编码器连接到的数字网络的最大上传速度(预设值)。术语“比特率”通常意指编码器连接到的数字网络的有效吞吐量。上面对于第二分辨率同样有效。下面将描述确定第一/第二分辨率的其它方式。

[0067] 根据本发明的第二方面，上面的目的由包括计算机可读存储介质的计算机程序产品实现，计算机可读存储介质具有被适配为由具有处理能力的设备执行时、执行第一方面的方法的指令。

[0068] 根据第三方面，上面的目的由被适配为以视频编码格式对由视频记录设备捕获的视频流进行编码的编码器来实现，其中视频编码格式支持将辅助帧纳入编码的视频流，辅助帧由编码的视频流中的另一帧引用，并且该辅助帧包括对编码的视频流中的另一帧进行补充的图像数据，该辅助帧包括标记变量，所述标记变量指示：不旨在当对编码的视频流进行解码时显示辅助帧的图像数据、而是将所述辅助帧(110)的图像数据用于与所述另一帧的数据结合以用于获取要显示的图像数据，其中编码器进一步被适配为：

[0069] -接收由视频捕获设备捕获的第一图像数据，

[0070] -确定解码时、用于视频流的预期分辨率，

[0071] -对第一图像数据进行按比例缩小，以获得按比例缩小的第一图像数据，其中按比例缩小的第一图像数据具有低于预期分辨率的第一分辨率，

[0072] -准备空的第一辅助帧，其中第一辅助帧的图像数据具有等于预期分辨率的分辨率，并包括全都具有同一预定义值的比特，

[0073] -将按比例缩小的第一图像数据粘贴到第一辅助帧的图像数据，

[0074] -将第一辅助帧编码为帧内帧，

[0075] -确定第一图像变换，用于将第一辅助帧的图像数据中的按比例缩小的第一图像数据按比例放大为具有预期分辨率的按比例放大的第一图像数据，

[0076] -根据至少一个预定的宏块尺寸，通过对由第一图像变换所导致的像素的移动进行采样来确定第一移动矢量，

[0077] -将第一图像数据编码成作为引用第一辅助帧的帧间帧的第一帧，其中第一帧的移动矢量与第一移动矢量相对应。

[0078] 根据第四方面，上面的目的由包括根据第三方面的编码器的系统来实现，编码器经数字网络连接到解码器，解码器被布置为对以编码器的视频编码格式编码的视频流进行解码，其中编码器被适配为：

[0079] -经数字网络接收预期分辨率，

[0080] -接收第一分辨率，

[0081] -根据接收到的预期分辨率和接收到的第一分辨率对视频流进行编码，[0082] -经数字网络传送编码的视频流，

[0083] 其中解码器被适配为：

[0084] -经数字网络接收编码的视频流，

[0085] -对编码的视频流进行解码，以获取解码的视频流。

[0086] 根据一些实施方式，该系统进一步包括显示器，其中编码器进一步被适配为：

[0087] -确定要被以第三分辨率纳入编码的视频流的第一图像数据的一部分ROI1，第三分辨率高于第一分辨率

[0088] -将具有第三分辨率的ROI1粘贴到第一辅助帧的图像数据，以使得ROI1不会覆写按比例缩小的第一图像数据，或变得被按比例缩小的第一图像数据覆写，从而使ROI1不与按比例缩小的第一图像数据重叠，

[0089] -确定第四图像变换，用于将具有预期分辨率的ROI1插入按比例放大的第一图像数据，

[0090] -通过对第四图像变换进行采样来确定第四移动矢量，

[0091] 其中，将第一图像数据编码成作为帧间帧的第一帧的步骤包括：将第一帧的移动矢量确定为与第一移动矢量和第四移动矢量相对应，

[0092] 其中解码器进一步被适配为：

[0093] -对编码的视频流进行解码，以获取解码的视频流，其中解码包括从第一辅助帧的图像数据提取ROI1，

[0094] -在显示器上、与解码的视频流分离地显示ROI1。

[0095] 在此实施方式中，自定义解码器既根据支持编码器的视频解码格式的解码器的标准解码方法、对编码的视频流进行解码，同时又从第一辅助帧提取ROI1的图像数据，以提供例如包括ROI1(可选地来自随后的辅助帧的其它兴趣区)的图像数据的静止图像或第二解码的视频流。此实施方式可以是有利的，因为分离地显示特殊兴趣区(ROI1)，以使得观看者能够看到ROI1的图像内容，而未受到从其提取ROI1的图像数据的剩余部分的图像内容的干扰。倘若解码的ROI1的分辨率大于解码的视频流的分辨率、因而当插入解码的视频流的图像内容时被按比例缩小ROI1的分离显示可能尤其有利。出于此因，根据一些实施方式，第三分辨率大于预期分辨率，其中在显示器上、与解码的视频流分离地显示ROI1的步骤包括：在显示器上以第三分辨率显示ROI1。

[0096] 第二、第三及第四方面通常可以具有与第一方面相同的特征及优点。进一步注意到本发明涉及特征的所有可能组合，除非另有明确规定。

附图说明

[0097] 参考附图，通过下面本发明的优选实施方式的说明性及非限制性的详细描述，将更好理解本发明上述及额外的目的、特征及优点，相同的引用编号将用于类似的元件，其中：

[0098] 图1示意性图示了用于以支持辅助帧的视频编码格式对视频流进行编码的方法的第一实施方式，

[0099] 图2示意性图示了用于以支持辅助帧的视频编码格式对视频流进行编码的方法的第二实施方式，

[0100] 图3示意性图示了用于以支持辅助帧的视频编码格式对视频流进行编码的方法的第三实施方式，

[0101] 图4示意性图示了包括根据图3的编码器的系统，编码器经数字网络连接到解码器，解码器被布置为对以编码器的视频编码格式编码的视频流进行解码，

[0102] 图5为根据实施方式、示出用于以支持辅助帧的视频编码格式对视频流进行编码的方法的流程图。

具体实施方式

[0103] 现在，下文将参考附图更完整地描述本发明，其中示出了本发明的实施方式。本文公开的系统及设备将被描述为在操作期间。

[0104] 本发明旨在针对支持将辅助帧纳入编码的视频流的视频编码格式提供持续视频流的动态缩放。这提供了了码率控制器在被要求降低编码的视频流的比特大小(比特率)时一起作用的另一可能性(除了压缩和帧频)，这在低的可用比特率时可能尤其有利。作为一个示例，相较于具有高压缩比率(例如量化参数QP为46)的高分辨率视频(例如FHD视频)，低分辨率视频流(例如VGA视频)在使压缩率(例如量化参数QP为28)保持较低的同时产生较好的质量，即使两个编码的视频流具有相同的比特率。

[0105] 现在结合图1至图2及图5来描述本发明的实施方式。

[0106] 图1示出了由视频捕获设备104捕获的场景102，其产生包括三个图像帧106a至106c的视频流106。图1的下部举例说明了以支持将辅助帧纳入编码的视频流的视频编码格式编码视频流的方法的实施例。编码器108接收视由频记录设备104捕获的第一图像数据
106a。编码器108确定解码时视频流的预期分辨率。如本文所述的，预期分辨率可以等于由视频记录设备104捕获的图像数据106的分辨率。然而，预期分辨率还可以不同于由视频记录设备104捕获的图像数据106的分辨率。例如，视频记录设备可以以非常高的分辨率捕获视频，对编码的视频流进行传输且后面进行解码所用的分辨率可以无需同样高。出于那一原因，预期分辨率可以低于由视频记录设备104捕获的图像数据106a-至106c的图像数据的分辨率，预期分辨率可以以不同的方式为编码器所知。例如，预期分辨率可以是可从编码器
108检索的硬编码的值(例如在编码器108的存储器中)。预期分辨率还可以是编码器108中的可配置值。该配置可以在那一情况下例如由用户进行，或从请求编码的视频流的设备设置。其它确定预期分辨率的方法当然是可能的。

[0107] 编码器接着对第一图像数据106a进行按比例缩小S504，以获取按比例缩小的第一图像数据114，其中按比例缩小的第一图像数据具有低于预期分辨率的第一分辨率118x*118y。可以使用任一公知的图像算法来执行按比例缩小，诸如最近邻插值、双线性及二元三次算法、盒采样等之类。

[0108] 第一分辨率可以基于编码器108连接到的数字网络的比特率来确定/设置S502。可以根据可从编码器108(例如在编码器的存储器中)检索的硬编码的值进一步对第一分辨率进行设置S502。第一分辨率还可以是编码器中的可配置值。在那一情况下，该配置可以例如由用户进行，或从请求编码的视频流的设备设置。确定/设置S502第一分辨率，以使得编码的视频流满足比特率需求。可以以迭代方式设置S502第一分辨率，以使得对编码的视频流的比特率/大小进行持续测量，且基于测量和比特率需求对预期分辨率进行适配。无论如何，第一分辨率，还可以称作按比例缩小因子，被设置S502，且用于对接收到的图像数据106a至106c进行按比例缩小。

[0109] 编码器108然后准备第一辅助帧110a，其中第一辅助帧110a的图像数据具有与预期分辨率相对应的分辨率116x*116y。辅助帧110的图像数据此时将为空(所有比特具有0值)，替换地，所有比特将具有缺省值，例如与颜色黑、白或绿相对应。从编码器的角度，具有与预定义的颜色相对应的缺省值可能是有利的。例如，如果各处使用相同的值(颜色)，可以降低比特率成本，在此情况下值易于编码(诸如颜色黑、白或绿)。然后，将按比例缩小的第一数据114插入S506随后被编码为帧内帧的第一辅助帧110a的图像数据。在图1的示例中，将按比例缩小的第一数据114插入辅助帧110a的图像数据的“右上角”(在图1中图像数据被可视化为矩阵)。然而，可以在任何位置将按比例缩小的第一数据插入第一辅助帧110a的图像数据，只要后面确定第一移动矢量(参见下面)时记住属于按比例缩小的第一数据的比特的索引。

[0110] 为了后面能够将按比例缩小的第一图像数据114按比例放大到预期分辨率116x*116y，确定S508移动矢量120。移动矢量120与将第一辅助帧110a的图像数据中按比例缩小的第一图像数据114按比例放大(数字材料的放大叫做按比例放大或分辨率增强)为具有预期分辨率116x*116y的按比例放大的第一图像数据相对应。移动矢量会因此将按比例缩小的第一数据114中的宏块“移”到具有预期分辨率的按比例放大的第一图像数据中的新位置。用于在解码器处实际按比例放大的算法取决于解码器的实现方式，但通常可以使用任意公知的图像缩放算法，诸如最近邻插值、双线性及二元三次算法、盒采样等。

[0111] 按比例放大由基于预期分辨率116x*116y、第一分辨率118x*118y和将按比例缩小的第一图像数据114插入辅助图像110a的图像数据的方式所确定的图像变换方程(图像变换、图像转换等)来定义。图像变换方程应用于按比例缩小的第一图像数据114(第二、按比例缩小的第三图像数据等)时，将具有第一分辨率118x*118y的按比例缩小的第一图像数据114按比例放大到具有预期分辨率116x*116y的图像数据。移动矢量表示图像变换方程，并可以以许多方式确定。根据一些实施方式，根据确定的宏块尺寸通过对图像变换方程进行采样来确定移动矢量。例如，如果图像变换方程导致将特定像素右移5个像素、下移3个像素，此像素的实际移动是基于采样尺寸(宏块尺寸)和用于邻近像素的变换来确定的。根据其它实施方式，多个宏块尺寸用于采样，其中用于映射策略的特定区域的宏块尺寸取决于图像变换方程对于那一对应区域如何呈现。例如，宏块尺寸能够从16x16变为降至4x4。此实施方式将降低用于移动矢量的比特率方面的成本，可以以有效的方式将大多数比特用于图像变换方程的、较小的宏块导致更正确的采样/映射的局部区域，并将较少的比特用于变换更一致的局部区域。

[0112] 为了进一步降低用于移动矢量的比特率成本，能够使采样更稀疏(增大宏块尺寸)，以使得由解码器来在接收到的移动矢量之间插值以计算用于较小尺寸的宏块的移动矢量，以实现辅助帧中图像数据更流畅的变换。这能够通过将插值参数纳入编码的比特流或在p-帧的头中设置标记等来实现。

[0113] 根据其它实施方式，基于辅助帧110a中按比例缩小的图像数据114的对应区域内的细节级别，进行获取移动矢量的图像变换方程的采样。例如，对于包括高度直线(能够使用任意合适的边缘检测算法来确定)的按比例缩小的图像数据114中的局部区域，图像变换中的对应区域可能需要较密集的采样(较小的宏块尺寸)。对于低度线的区域，可以采用较稀疏的采样。

[0114] 当确定了第一移动矢量120时，可以将第一帧112a编码S510为引用第一辅助帧110a(如上所述被编码为帧内帧)的帧间帧，其中第一帧112a的移动矢量120(由第一帧112a中的箭头示意性图示)与如上所述所确定的第一移动矢量120相对应。可以注意第一帧112a的移动矢量120可以是预先计算的，并且例如存储在编码器可访问的存储器中。第一分辨率与预期分辨率之间的比率可以用作例如具有比率和对应的移动矢量的数据库中的查找值(此类数据库中的值可以假设以特定方式将按比例缩小的图像数据插入辅助帧的图像数据，例如在左上角或在左下角等)。基于如上所述的预期分辨率和第一分辨率，可以在编码器108运行时进一步计算运动矢量。

[0115] 如上所述，本发明的优点是支持编码器所用的视频编码格式(例如H.265)的标准解码器能够根据图1对视频流进行解码。解码器将第一帧112a的移动矢量120应用于第一辅助帧110a的按比例缩小的第一图像数据114，以实现第一辅助帧110a的按比例缩小的第一图像数据114的按比例放大，从而以具有预期分辨率116x*116y的解码的图像数据结束。

[0116] 图2示出了图1中描述的方法的扩展，其中视频流106的所有三个捕获的图像帧(图像数据)106a至106c由编码器108编码。在图2中，如图1和图5中的步骤S502-S510所描述的对第一图像数据106a进行编码，以获取编码的第一帧112a和编码的第一辅助帧110a。对第一图像数据106a进行编码后，编码器108接收第二图像数据106b。以用于第一辅助帧110a的如上所述的类似方式对第二辅助帧110b的图像数据进行编辑。

[0117] 第二辅助帧110b被有利地编码为引用第一辅助帧110a的帧间帧(例如P帧)，以利用之前图像帧(在此情况下为第一辅助帧110a)中的时间冗余信息。根据一些实施方式，第二辅助帧110b的编码因此基于第二图像数据106b和第一图像数据106a之间的比较进行。在图2中，编码的第二辅助帧110b由移动矢量(在右上角)示意性地表示，但当然也可以将描述不存在于第一辅助帧的图像数据、但存在于第二图像数据和/或预测误差(也称作余值)的图像内容的图像数据纳入编码的第二辅助帧110b。

[0118] 根据其它实施方式，还将第二辅助帧110b编码为I帧。

[0119] 编码器108通过对引用第二辅助帧110b的第二帧112b进行编码来继续，第二帧被编码为帧间帧。确定第二帧的移动矢量，以使得它们与间第二辅助帧110b的图像数据中的按比例缩小的第二图像数据按比例放大到具有预期分辨率的的按比例放大的第二图像数据的相对应。在此情况下，第二帧112b的移动矢量等于第一帧112a的移动矢量，因为使用了关于第一图像数据106a而言的相同的缩放因子对第二图像数据106b进行了按比例缩小，将按比例缩小的第二图像数据插入与如何将按比例缩小的第一图像数据114插入第一辅助帧110a相对应的第二辅助帧110b的图像数据中的位置。结果，可以通过复制第一帧的移动矢量来确定第二帧11b的移动矢量。如上结合用于第一帧112a的图1所描述的，可以使用确定第二帧的移动矢量的任一其它方式。换言之，使用另一图像数据106b、且根据预期分辨率和按比例缩小因子/第一分辨率来确定另一辅助帧110b和另一帧112b。将另一辅助帧110b编码为引用前一辅助帧110a的帧间帧。将另一帧112b编码为引用另一辅助帧110b的帧间帧。
只要未达到GOP的结束(如图5的步骤512所确定的)，就为排列的下一图像数据(例如第三图像数据106c)重复/迭代上面的过程S512，以对帧间帧编码的辅助帧和帧间帧编码的常规帧进行编码。

[0120] 如果到达GOP的结束(如图5的步骤512所确定的)，确定S516是否需要新的按比例缩小因子(例如有改变比特率的需求，以使得需要新的按比例缩小因子来满足新需求，或者，之前的按比例缩小因子不足以满足当前需求)。若否，编码过程在步骤S504继续，以用于排列的下一图像数据(例如第三图像数据106c)。

[0121] 本发明的优点是能够实现捕获的图像数据106a至106c的动态缩放。结果，编码器能够非常快速地对关于减小编码的视频流的比特大小(比特率)的新需求做出反应，例如可用带宽的变化。在图2的示例中，对于第三图像数据106c，确定S516需要新的按比例缩小因子，在此示例中，例如因更可用的带宽等而使用/设置S502较低的按比例缩小因子。接着，用新的较低按比例缩小因子重复步骤S504-S510。由于按比例缩小因子在第二图像数据106b和第三图像数据106c之间变化，将第三辅助帧110c编码S506为帧内帧是有利的。对于由视频捕获设备104捕获的第三图像数据106c，根据此实施方式的编码过程包括：对第三图像数据106c进行按比例缩小S504，以获取按比例缩小的第三图像数据116，其中按比例缩小的第三图像数据116具有第二分辨率，第二分辨率(图2未示出)不同于第一分辨率(即如图1所示，118x*118y)、且低于预期分辨率(即如图1所示，116x*116y)。准备第三辅助帧110c，第三辅助帧110c的图像数据具有预期分辨率116x*116y，将按比例缩小的第三图像数据116插入S506以帧内帧编码的第三辅助帧110c的图像数据。编码器然后确定S508与将第三辅助帧110c的图像数据中的按比例缩小的第三图像数据116按比例放大到预期分辨率116x*116y相对应的第三移动矢量(在图2中由第三帧112c的箭头示意性图示)。可以如上所述为第一帧112a确定第三移动矢量。在此之后，编码器能够将第三帧112c编码S510为引用第三辅助帧110c的帧间帧，其中第三帧的移动矢量与第三移动矢量相对应。

[0122] 在图2(类似地在下面的图3-4)中，括号内的数字描述了将编码的辅助帧110(AF)和“常规”帧112(RF)纳入编码的视频流的次序。对于图2的示例，次序为：AF1 110a，RF1 112a，AF2 110b，RF2 112b，AF3 110c，RF3 112c。

[0123] 仅将辅助帧110的图像数据的一部分用于传输由图像捕获设备104所获的图像数据106a至106c的进一步优点(除了动态码率控制可能性)是可以将辅助帧110的图像数据的空部分用于提供较高分辨率的捕获的图像数据106a至106c的一部分304。此类部分有利地对于观看者(或图像分析软件)具有特殊兴趣，例如人的面部或车的牌照。图3中举例说明了此实施方式。

[0124] 在图3中，确定第一图像数据的一部分304。要以第三分辨率将部分304纳入编码的视频流，其中第三分辨率高于第一分辨率。例如，如果第一分辨率为720P，那么第三分辨率可以是4K。根据一些实施方式，第一分辨率可以等于预期分辨率。然而，倘若以高于预期分辨率的分辨率来捕获图像数据106a至106b，如果第三分辨率大于预期分辨率，例如等于由视频捕获设备捕获的图像数据106a至106b的分辨率，或介于图像数据106a至106b的分辨率和预期分辨率之间，这可能是有利的。

[0125] 在部分304被确定后，它被可选地按比例缩小到第三分辨率(倘若它还不是第三分辨率，即如果第三分辨率为捕获的图像数据106a的分辨率)。下文将第三分辨率的部分304称作ROI1，在图3中示为具有引用302。然后，将ROI1302插入第一辅助帧110a的图像数据，以使得ROI1 302不会覆写按比例缩小的第一图像数据114，或变得被按比例缩小的第一图像数据114覆写，即使得ROI1 302将不会与按比例缩小的第一图像数据114重叠。

[0126] 下一步骤是确定与将具有预期分辨率的ROI1 302插入按比例缩小的图像数据114的按比例放大版本相对应的(第四)移动矢量。例如通过基于第三分辨率、预期分辨率和第一辅助图像110a的图像数据中ROI1的位置对图像变换方程进行采样，能够以与如上所释的用于第一、第二、第三移动矢量的相同的方式来确定这些移动矢量。第四移动矢量在图3中被示意性示为第一帧112a的右上角的箭头。然后，将第四移动矢量用于确定帧间帧编码的第一帧112a的移动矢量。换言之，将第一帧112a编码为帧间帧的步骤包括：确定与第一移动矢量(用于将按比例缩小的图像数据114按比例放大至预期分辨率)和第四移动矢量相对应的第一帧112a的移动矢量。

[0127] 仍然将第一辅助帧110a编码为帧内帧。

[0128] 对于第二图像数据106b，可以如上所述、利用时间视频压缩来进行此图像数据中兴趣部分的编码，以使得将第二辅助帧110b编码为帧间帧。出于那一原因，如果将第三分辨率的部分第二图像数据、ROI2插入与第一辅助帧110a的图像数据中ROI1的位置相对应的第二辅助帧110b的图像数据中的位置，这可能是有利的。将ROI2插入第二辅助帧的图像数据，以使得ROI2不会覆写按比例缩小的第二图像数据，或变得被按比例缩小的第二图像数据覆写。然后，确定与将具有预期分辨率的ROI2插入按比例放大的第二图像数据相对应的第五移动矢量，将第二帧110b编码为帧间帧包括确定与第二移动矢量和第五移动矢量相对应的第二帧的移动矢量。

[0129] 如上结合图1至图3所述的，编码器108因而被被适配为对视频流106进行编码。编码器108可以直接在视频捕获设备104中提供，或有线或无线连接到视频捕获设备104，以接收视频流106的图像数据106a-d。编码器108可以包括或连接到用于检索预先计算的移动矢量的存储器。编码器108可以包括用于计算图像变换方程(即用于按比例缩小的图像数据的按比例放大的方程和/或用于将ROI1/ROI2置于按比例放大图像数据中正确位置和比例的方程)、和/或根据图像变换方程对移动矢量进行采样的处理单元。或者或另外，编码器可以被被适配为从被适配为计算/确定此类图像变换方程和/或移动矢量的独立计算单元接收图像变换方程和/或移动矢量。根据一些实施方式，此类独立的计算单元创建整个第一/第二/第三帧，其后来与编码器108中的辅助帧互连。如上所述，编码器108可以进一步被被适配为对由视频捕获设备104捕获的图像数据106a-d进行按比例缩小。根据一些实施方式，编码器从独立的缩放单元接收按比例缩小的图像数据。编码器一般包括一个或数个用于如上所述、对接收到的图像数据进行编码的处理单元(例如CPU)。CPU可以例如被被适配为运行从计算机可读存储介质安装的软件，计算机可读存储介质具有被适配为由CPU执行时、执行任一上面描述的实施方式的编码方法的指令。编码器可以进一步被被适配为无线或有线地将编码的视频流传送(经例如互联网)给被适配为对编码的视频流进行解码的解码器。

[0130] 图4通过举例公开了一种包含如上公开的编码器108的系统。编码器108经数字网络402连接到解码器404，解码器404布置为对以编码器108的视频编码格式编码的视频流416进行解码。视频编码格式可以是列表之一：高效图像文件格式、高效视频编码H.265、H.264、VP10、VP9、AV1、高级视频编码及H.266。然而，应该注意到本发明涵盖了如本文所描述的任一支持辅助帧的视频编码格式。

[0131] 编码器108因而根据预期分辨率和第一分辨率(按比例缩小因子)，对由视频捕获设备捕获的多个图像数据106a-b进行编码。根据一些实施方式，预期分辨率可以从数字网络402接收408，例如由客户端应用418或接收编码的视频流416的用户确定并经数字网络402传送405到编码器。第一分辨率可以基于编码器连接到的数字网络的比特率来确定406，即编码器108和解码器404之间数字网络402的有效吞吐量。或者，它可以是独立的、基于如上所述测量的此类比特率来确定第一分辨率的码率控制单元。码率控制单元可以持续地将第一(第二等)分辨率传递给编码器，或只有它从当前所用的发生改变，例如当带宽条件改变时，才传递此类分辨率。第一分辨率可以以其它方式确定，并由编码器108接收。例如，可以基于由视频捕获设备捕获的视频流106的质量来确定第一分辨率(类似地图2的第二分辨率)。如果在黑暗条件下、例如夜间捕获视频流，视频流106(图像数据106a至106c)通常包括许多噪声，降低了视频流的质量，因而相较于如果日间捕获视频流106，使得较低的分辨率有利。其它确定第一分辨率的示例包括从意欲观看后面解码的视频流的用户、或从将分析后面解码的视频流的视频分析软件接收此类信息。

[0132] 编码器108被被适配为经数字网络402传输编码的视频流。解码器404被被适配为经数字网络402接收编码的视频流416，并对编码的视频流416进行解码以获取解码的视频流。

[0133] 根据一些实施方式，该系统包括显示器418。解码器可以连接到显示器418，并将解码的视频流传送给显示器418，从而以预期分辨率显示410。

[0134] 根据如上所述、以第三分辨率将第一图像数据106a的部分304(本文称作ROI1)纳入编码的视频流416的实施方式，解码器404可以进一步被被适配为对编码的视频流进行解码，以获取解码的视频流，其中解码包括从第一辅助帧的图像数据提取ROI1，且在显示器上、例如以第三分辨率(或解码器404确定的任一其它分辨率)、与解码的视频流分离地412显示ROI1。ROI1还被纳入414从辅助帧取出的、使用例如第一/第二帧112a-b的移动矢量按比例放大的图像数据410。

[0135] 要理解本领域技术人员能够以许多方式修改上面描述的实施方式，且仍利用如上面的实施方式所示的本发明的优点。例如，能够以任意适当的方式改变对辅助帧和对辅助帧进行补充的帧进行编码的次序。例如，在将引用与编码的辅助帧交错的辅助帧的帧间编码的帧纳入编码的视频流之前，可以首先对GOP内的所有辅助帧进行编码。因此，本发明不该受限于所示的实施方式，但应该仅由所附的权利要求限定。另外，如本领域技术人员所理解的，可以对所示的实施方式进行组合。

以支持辅助帧的视频编码格式编码视频流的方法及编码器转让专利

申请号 : CN201811197067.3

文献号 : CN109688410B

文献日 : 2021-01-29

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 维克托·埃德帕尔姆 , 汉普斯·林瑟

申请人 : 安讯士有限公司

摘要 :

权利要求 :

说明书 :

以支持辅助帧的视频编码格式编码视频流的方法及编码器

技术领域

背景技术

发明内容

附图说明

具体实施方式