一种用于室内监控场景的视频压缩方法及系统专利检索-本技术领域的技术人员说明书国际申请第I章专利权专利检索查询-专利查询网

积极推动地理标志专门立法

2022-03-10 地理标志，立法，知识产权
保护知识产权是对创新最大的激励

2022-03-10 保护知识产权，创新，激励
谢商华：加快制定知识产权基本法

2022-03-10 知识产权基本法
擦亮“双奥之城”品牌

2022-03-10 双奥，知识产权
让冰雪运动“热”力全开

2022-03-10 冰雪运动，知识产权
携手共奋进　走好强国路

2022-03-10 强国，知识产权
坚持创新引领　方能稳中求进

2022-03-10 创新，稳中求进，知识产权
答好“两张卷” 奋进新征程

2022-03-10 知识产权
专家解读政府工作报告中的创新和知识产权相关部署

2022-03-10 政府工作报告，创新，知识产权
今年政府工作报告指出：加强知识产权保护和运用

2022-03-10 政府工作报告，知识产权保护

一种用于室内监控场景的视频压缩方法及系统

阅读：199发布：2021-02-28

IPRDB可以提供一种用于室内监控场景的视频压缩方法及系统专利检索，专利查询，专利分析的服务。并且本发明公开了一种用于室内监控场景的视频压缩方法及系统，属于视频压缩领域，本发明要解决的技术问题为如何针对室内监控视频进行有效的视频压缩，提高视频压缩性能，技术方案为：该方法步骤如下：S1、关键帧选取；S2、利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类；S3、对步骤S2中预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；S4、在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；S5、视频解压重构。该系统包括关键帧选取模块、边界框预测以及预测分类模块、抠图及压缩保存模块、人员图像保存模块、视频解压重构模块。，下面是一种用于室内监控场景的视频压缩方法及系统专利的具体信息内容。

权利要求

1.一种用于室内监控场景的视频压缩方法，其特征在于，该方法步骤如下：S1、关键帧/背景图的选取：在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；

S2、利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类：通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；

S3、抠图及压缩保存：对步骤S2中预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；

S4、保存人员图像：在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；

S5、视频解压重构：在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构。

2.根据权利要求1所述的用于室内监控场景的视频压缩方法，其特征在于，所述步骤S1中关键帧的选取具体步骤如下：S101、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

S102、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

S103、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

3.根据权利要求1或2所述的用于室内监控场景的视频压缩方法，其特征在于，所述步骤S2中利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类具体步骤如下：S201、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

S202、视频帧中各个主体被框定之后就是对各个框内主体的类别判定。

4.根据权利要求3所述的用于室内监控场景的视频压缩方法，其特征在于，所述步骤S3中抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存。

5.根据权利要求4所述的用于室内监控场景的视频压缩方法，其特征在于，所述步骤S4中的位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；

步骤S4中存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

6.根据权利要求5所述的用于室内监控场景的视频压缩方法，其特征在于，所述步骤S5中视频解压重构的具体步骤如下：S501、将无人员视频帧段通过连续重复播放关键帧来重构；

S502、有人员视频帧段通过将人员图像按对应帧数信息和人员图像帧内位置信息将人员图片贴回关键帧中进而重构出有人员的视频帧段。

7.一种用于室内监控场景的视频压缩系统，其特征在于，该系统包括，关键帧/背景图的选取模块，用于在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；

边界框预测以及预测分类模块，用于利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类，通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；

抠图及压缩保存模块，用于对预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；

人员图像保存模块，用于在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；

视频解压重构模块，用于在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构。

8.根据权利要求7所述的用于室内监控场景的视频压缩系统，其特征在于，所述关键帧/背景图的选取模块工作过程如下：(1)、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

(2)、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

(3)、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

9.根据权利要求7或8所述的用于室内监控场景的视频压缩系统，其特征在于，所述边界框预测以及预测分类模块的工作过程如下：①、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

②、视频帧中各个主体被框定之后就是对各个框内主体的类别判定。

10.根据权利要求9所述的用于室内监控场景的视频压缩系统，其特征在于，所述抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存；

人员图像保存模块中位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；

人员图像保存模块中存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

说明书全文

一种用于室内监控场景的视频压缩方法及系统

技术领域

[0001] 本发明涉及视频压缩领域，具体地说是一种用于室内监控场景的视频压缩方法及系统。

背景技术

[0002] 随着监控摄像头的使用范围不断扩大，和监控摄像头的清晰度越来越高，拍摄出来的视频越来越多，同时视频的质量也越来越高，这导致大大增加了存储视频所需的比特率，特别是在学校、银行、写字楼内等领域，国家对监控视频存储的时间要求更为严格。由于监控视频通常都是长时间连续不断的拍摄导致视频时长非常长体积巨大，然而限于存储空间的限制，监控视频储存时需要定期覆盖掉之前的记录视频。这样便导致了在需要查看之前视频时却发现原有视频已被覆盖，失去了监控视频的意义。例如，根据《中华人民共和国公共安全行业标准》，公安部安防系统记录资料的保存期不应少于30天，银行相同；要害部位如取款机面部、现金柜台、金库等现在一般银监局都建议各银行最低保存90天；这就导致了银行等监控场景对视频存储的需求更加迫切。而在这种情况下，如果仅仅是增加存储的空间是不实际的，视频压缩技术应运而生。

[0003] 视频压缩技术用于录像资料收集、整理、存储，高性能的视频压缩技术甚至用于远程视频网络传输，因此，在安防监控市场DVR(数字化硬盘录像监控)技术中，成为先进的数字化网络监控，不论是在监视、录像存储、画面检索、网络传输、信息安全保密以及控制技术方面相比传统的模拟监控技术，大大提高了视频监控领域的效率。

[0004] 在深度学习风靡之前，人们提出了很多传统的视频压缩方法，最常用的传统视频压缩方法包括：MPEG-4、H.264和H.265等。这些算法大都遵循传统的视频压缩框架，然而传统框架是针对于所有场景的统一硬编码方法，因此无法对日益增长的需求和室内安防监控等单一简单的具有极大压缩潜力的特定场景进行有效压缩。随着深度学习在图像视频领域的蓬勃发展，很多基于神经网络的新图像视频处理技术越来越多的被应用到视频压缩领域来优化和提高视频压缩。故如何针对室内监控视频摄像头固定、视频背景单一、光源变化小的特点进行有效的视频压缩，缩小室内监控视频的存储空间，提高视频压缩性能是目前现有技术中急需解决的技术问题。

发明内容

[0005] 本发明的技术任务是提供一种用于室内监控场景的视频压缩方法及系统，来解决如何针对室内监控视频摄像头固定、视频背景单一、光源变化小的特点进行有效的视频压缩，缩小室内监控视频的存储空间，提高视频压缩性能的问题。

[0006] 本发明的技术任务是按以下方式实现的，一种用于室内监控场景的视频压缩方法，该方法步骤如下：

[0007] S1、关键帧/背景图的选取：在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；

[0008] S2、利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类：通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；

[0009] S3、抠图及压缩保存：对步骤S2中预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；

[0010] S4、保存人员图像：在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；

[0011] S5、视频解压重构：在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构。

[0012] 作为优选，所述步骤S1中关键帧的选取具体步骤如下：

[0013] S101、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

[0014] S102、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

[0015] S103、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

[0016] 更优地，所述步骤S2中利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类具体步骤如下：

[0017] S201、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

[0018] S202、视频帧中各个主体被框定之后就是对各个框内主体的类别判定；YOLO3目标检测算法可以识别包括人、车、电脑等200余种物品的识别和判定。

[0019] 更优地，所述步骤S3中抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存。

[0020] 作为优选，所述步骤S4中的位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；

[0021] 步骤S4中存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

[0022] 更优地，所述步骤S5中视频解压重构的具体步骤如下：

[0023] S501、将无人员视频帧段通过连续重复播放关键帧来重构；

[0024] S502、有人员视频帧段通过将人员图像按对应帧数信息和人员图像帧内位置信息将人员图片贴回关键帧中进而重构出有人员的视频帧段。

[0025] 一种用于室内监控场景的视频压缩系统，该系统包括，

[0026] 关键帧/背景图的选取模块，用于在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；

[0027] 边界框预测以及预测分类模块，用于利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类，通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；

[0028] 抠图及压缩保存模块，用于对预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；

[0029] 人员图像保存模块，用于在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；

[0030] 视频解压重构模块，用于在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构。

[0031] 作为优选，所述关键帧/背景图的选取模块工作过程如下：

[0032] (1)、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

[0033] (2)、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

[0034] (3)、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

[0035] 更优地，所述边界框预测以及预测分类模块的工作过程如下：

[0036] ①、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

[0037] ②、视频帧中各个主体被框定之后就是对各个框内主体的类别判定；YOLO3目标检测算法可以识别包括人、车、电脑等200余种物品的识别和判定。

[0038] 更优地，所述抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存；

[0039] 人员图像保存模块中位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；

[0040] 人员图像保存模块中存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

[0041] 本发明的用于室内监控场景的视频压缩方法及系统具有以下优点：

[0042] (一)、本发明是基于深度学习的专门针对室内监控视频等简单监控场景的视频压缩算法，在满足视频不失真的条件下，尽量减少视频的大小与存储空间，使视频存储更加高效，低成本；其中运用到的主要深度学习方法是基于YOLO3框架的目标检测算法，用于对视频中的人员进行抠图；

[0043] (二)、本发明只需存储少量无损图片作为背景图，以及若干含有人员的尺寸非常小的图片和定位信息就可以对视频实现高效压缩，大大缩小了存储空间，提高了视频压缩性能；

[0044] (三)、本发明通过巧妙的算法设计对单一场景的室内监控视频进行高效压缩从而极大的减少的监控视频存储的空间和代价，同时结合深度学习的高效视频压缩方法，极大的减少了视频存储体积，降低了视频存储成本；

[0045] (四)、本发明实现了仅通过储存少量关键帧和若干人员图像及其相关信息就达到了高效视频压缩的目的。

附图说明

[0046] 下面结合附图对本发明进一步说明。

[0047] 附图1为用于室内监控场景的视频压缩方法的流程框图；

[0048] 附图2为用于室内监控场景的视频压缩系统的结构框图。

具体实施方式

[0049] 参照说明书附图和具体实施例对本发明的一种用于室内监控场景的视频压缩方法及系统作以下详细地说明。

[0050] 实施例1：

[0051] 如附图1所示，本发明的用于室内监控场景的视频压缩方法,该方法步骤如下：

[0052] S1、关键帧/背景图的选取：在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；具体步骤如下：

[0053] S101、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

[0054] S102、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

[0055] S103、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

[0056] S2、利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类：通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；具体步骤如下：

[0057] S201、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

[0058] S202、视频帧中各个主体被框定之后就是对各个框内主体的类别判定；YOLO3目标检测算法可以识别包括人、车、电脑等200余种物品的识别和判定。

[0059] S3、抠图及压缩保存：对步骤S2中预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存。

[0060] S4、保存人员图像：在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

[0061] S5、视频解压重构：在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构；具体步骤如下：

[0062] S501、将无人员视频帧段通过连续重复播放关键帧来重构；

[0063] S502、有人员视频帧段通过将人员图像按对应帧数信息和人员图像帧内位置信息将人员图片贴回关键帧中进而重构出有人员的视频帧段。

[0064] 实施例2：

[0065] 如附图2所示，本发明的用于室内监控场景的视频压缩系统，该系统包括，[0066] 关键帧/背景图的选取模块，用于在检测不到人员的视频帧段内选取第一张视频帧作为关键帧/背景图，并以图片格式保存；

[0067] 边界框预测以及预测分类模块，用于利用基于YOLO3的目标检测对每一帧视频图像进行边界框预测以及预测分类，通过目标检测技术对监控视频中的每一帧图像进行检测，将图像中的主体分别用锚框框出，再对描框框出的主体进行分类预测；

[0068] 抠图及压缩保存模块，用于对预测为人的边界框进行抠图并以jpg的图片格式对抠出的人员图像进行压缩保存；抠图具体是对锚框内的主体被目标检测算法预测为人的框进行定位和抠图，并将抠出的人员图片以图像格式保存；

[0069] 人员图像保存模块，用于在保存人员图像时，同时把帧数与人员图像在原图中的位置坐标信息以人员图片文件名的形式一并存储；人员图像保存模块中位置坐标信息是使用预测框的左上角坐标点信息与视频框的右下角坐标点信息进行定位；人员图像保存模块中存储的方式是将帧数信息与帧内的位置坐标信息以保存图片文件名的方式记录。

[0070] 视频解压重构模块，用于在还原视频时在有人员出现的视频帧中将人员图像复原回原视频帧与位置信息，剩余视频帧均采用关键帧/背景帧进行视频重构。

[0071] 其中，关键帧/背景图的选取模块工作过程如下：

[0072] (1)、利用YOLO3框架对每一帧视频进行目标检测，以是否在视频中检测到人员为判断标准；

[0073] (2)、将整段视频分为若干无人员视频段与有人员视频段且不打乱原有视频帧的顺序；

[0074] (3)、将每段无人员视频帧段的第一张视频帧作为关键帧/背景帧，并以jpg的图片格式进行压缩保存。

[0075] 边界框预测以及预测分类模块的工作过程如下：

[0076] ①、利用YOLO3目标检测算法对每一帧图像进行边界框/锚框/预测框的预测，将视频帧中的各个主体用合适大小的框进行框定，方便后续算法对框内主体的类别预测和对边界框的坐标获取；

[0077] ②、视频帧中各个主体被框定之后就是对各个框内主体的类别判定；YOLO3目标检测算法可以识别包括人、车、电脑等200余种物品的识别和判定。

[0078] 最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

标题	发布/更新时间	阅读量
居家养老人员活动异常预警方法和装置-专利编号CN110349372A	2020-05-12	645
城市活动人口统计方法及其装置、计算机可读介质-专利编号CN109118413A	2020-05-12	607
建筑企业人员证书管理方法及系统-专利编号CN107689018A	2020-05-12	364
一种基于网络数据库技术的工程监理信息管理方法和系统-专利编号CN108492090A	2020-05-11	400
一种基于深度学习的施工现场人员制服穿着识别的方法-专利编号CN108491830A	2020-05-13	918
一种人员隔离观察箱及基板加工设备-专利编号CN110312368A	2020-05-13	838
人员识别方法和装置-专利编号CN102521583A	2020-05-11	227
一种基于人脸识别的数据更新方法及装置-专利编号CN108961495A	2020-05-11	173
一种煤矿井下人员管理系统-专利编号CN101436318A	2020-05-11	700
人员进出管理方法、装置、设备和存储介质-专利编号CN109726898A	2020-05-13	171

一种用于室内监控场景的视频压缩方法及系统

一种用于室内监控场景的视频压缩方法及系统

技术领域

背景技术

发明内容

附图说明

具体实施方式

IPRDB

热门服务

关于我们

友情链接

联系方式