一种视频分析方法、装置、系统、设备及存储介质转让专利

申请号 : CN202010182741.1

文献号 : CN111401239B

文献日 : 2021-04-20

本申请提供了一种视频分析方法、装置、系统、设备及存储介质，其中，视频分析方法包括：获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；利用预先构建的多个场景分别对应的视频分析规则，对目标图像帧进行事件识别，获得识别到的事件以及识别到的事件对应的概率，其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像；根据识别到的事件以及识别到的事件对应的概率，确定目标场景中是否发生了所述目标场景对应的目标事件。本申请提供的视频分析方法可自动实现多个不同场景所对应目标事件的检测。

1.一种视频分析方法，其特征在于，包括：获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

利用预先构建的多个场景分别对应的视频分析规则和所述目标图像帧，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，其中，所述目标场景为所述多个场景中的任一场景，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像，一场景对应的视频分析规则为用于确定待分析图像帧中发生该场景对应的目标事件的概率的规则；

根据所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，确定识别到的事件和识别到的事件对应的概率；

根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件；

当目标场景发生了目标场景对应的目标事件时，将目标图像帧序列和区域指示信息发送至终端，以使所述终端展示所述目标图像帧序列，并在所述目标图像帧序列中展示区域指示信息所指示的区域的检测框和跟随框，其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧，所述区域指示信息用于指示所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

2.根据权利要求1所述的视频分析方法，其特征在于，还包括：当所述目标场景中发生了所述目标场景对应的目标事件时，存储所述目标图像帧序列。

3.根据权利要求1所述的视频分析方法，其特征在于，预先构建任一场景对应的视频分析规则的过程包括：

从该场景对应的样本图像中确定出目标区域，其中，所述目标区域为与该场景对应的目标事件相关的区域；

从所述目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集；

利用所述角点集构建决策树，将构建的决策树作为该场景对应的视频分析规则。

4.根据权利要求3所述的视频分析方法，其特征在于，所述从所述目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集，包括：利用预先构建的角点决策器，确定所述目标区域中的每个像素点是否为角点，以得到由确定出的角点组成的角点集；

其中，所述角点决策器以训练集中的训练像素为样本，以所述训练像素对应的像素类别为标签训练得到，一个像素的像素类别为角点或非角点。

5.根据权利要求4所述的视频分析方法，其特征在于，构建所述角点决策器的过程包括：

从角点决策器的训练图像中获取目标像素点集，其中，所述目标像素点集由所述训练图像中可能包含角点的区域中的像素点组成；

根据所述目标像素点集中像素点的亮度，确定所述目标像素点集中每个像素点的像素类别；

以所述目标像素点集中像素点对应的信息增益为依据，用所述目标像素点集中的像素和所述目标像素点集中像素对应的像素类别训练角点决策器。

6.根据权利要求5所述的视频分析方法，其特征在于，所述根据所述目标像素点集中像素点的亮度，确定所述目标像素点集中每个像素点的像素类别，包括：对于所述目标像素点集中的每个像素点，根据该像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，以得到所述目标像素点集中每个像素点的像素类别。

7.根据权利要求6所述的视频分析方法，其特征在于，所述根据该像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，包括：若该像素点的邻域圆上的四个目标像素点中有至少连续三个目标像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮度值，则确定该像素点为候选角点，其中，所述四个目标像素为将该像素点的邻域圆四等分的四个像素点，一像素点对应的第一亮度值为该像素点的亮度值与预设亮度值的和，该像素点对应的第二亮度值为该像素点的亮度值与所述预设亮度值的差；

当该像素点为候选角点时，若该像素点的邻域圆上存在连续预设个像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮度值，则确定该像素点为角点。

8.根据权利要求5所述的视频分析方法，其特征在于，确定所述目标像素点集中一像素点对应的信息增益的过程包括：

根据所述目标像素点集中所包含的角点的数量和非角点的数量计算所述目标像素点集的信息熵；

获取该像素点对应的三个子向量，并分别确定该像素点对应的三个子向量的信息熵，其中，该像素点对应的三个子向量分别由所述训练图像中该像素点的邻域圆上亮度大于或等于该像素点对应的第一亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小于或等于该像素点对应的第二亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小于所述第一亮度值且大于所述第二亮度值的像素点的像素值组成；

根据所述目标像素点集的信息熵和该像素点对应的三个子向量的信息熵，确定该角点对应的信息增益。

9.根据权利要求1所述的视频分析方法，其特征在于，所述利用预先构建的多个场景分别对应的视频分析规则和所述目标图像帧，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，包括：从所述目标图像帧中确定出与所述目标场景对应的目标事件可能相关的目标区域；

从所述目标图像帧的目标区域中确定角点，以得到由确定出的角点组成的目标角点集；

利用所述目标角点集和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率。

10.根据权利要求9所述的视频分析方法，其特征在于，所述利用所述目标角点集和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，包括：对于所述目标角点集中的每个角点，若该角点不是以其为中心的邻域所包含的角点中的最优角点，则将该角点从所述目标角点集中删除；

利用剩余角点组成的角点集合和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率。

11.根据权利要求10所述的视频分析方法，其特征在于，确定一个角点是否为以其为中心的邻域所包含的角点中的最优角点，包括：确定以该角点为中心的邻域所包含的所有角点分别对应的目标值，其中，一个角点对应的目标值为该角点的邻域圆上各像素点分别与该角点的像素值差的绝对值之和；

若该角点对应的目标值不是确定出的所有目标值中的最大值，则确定该角点不是以其为中心的邻域所包含的角点中的最优角点，否则，确定该角点是以其为中心的邻域所包含的角点中的最优角点。

12.一种视频分析装置，其特征在于，包括：图像帧获取模块、事件识别模块、事件判别模块和数据发送模块；

所述图像帧获取模块，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

所述事件识别模块，用于利用预先构建的多个场景分别对应的视频分析规则和所述目标图像帧，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，其中，所述目标场景为所述多个场景中的任一场景，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像，一场景对应的视频分析规则为用于确定待分析图像帧中发生该场景对应的目标事件的概率的规则；

所述事件判别模块，用于根据所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，确定识别到的事件和识别到的事件对应的概率，根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件；

所述数据发送模块，用于当所述目标场景发生了所述目标场景对应的目标事件时，将目标图像帧序列和区域指示信息发送至终端，以使所述终端展示所述目标图像帧序列，并在所述目标图像帧序列中展示区域指示信息所指示的区域的检测框和跟随框，其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧，所述区域指示信息用于指示所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

13.一种视频分析系统，其特征在于，包括：配置单元、存储单元、分析单元和监控管理单元；

所述配置单元，用于预先构建多个场景分别对应的视频分析规则，其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像，一场景对应的视频分析规则为用于确定待分析图像帧中发生该场景对应的目标事件的概率的规则；

所述存储单元，用于存储所述多个场景分别对应的视频分析规则；

所述分析单元，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；利用所述多个场景分别对应的视频分析规则和所述目标图像帧，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率；根据所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，确定识别到的事件和识别到的事件对应的概率；根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件，其中，所述目标场景为所述多个场景中的任一场景；

所述监控管理单元，用于将目标图像帧序列和区域指示信息发送至终端，以使所述终端展示所述目标图像帧序列，并在所述目标图像帧序列中展示所述区域指示信息所指示的区域的检测框和跟随框；

其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧，所述区域指示信息用于指示所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

14.根据权利要求13所述的视频分析系统，其特征在于，还包括：报警管理单元；

所述报警管理单元，用于当所述目标场景中发生了所述目标场景对应的目标事件时，向报警设备发送报警指令，并存储所述目标图像帧序列。

15.一种视频分析设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1～11中任一项所述的视频分析方法的各个步骤。

16.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1～11中任一项所述的视频分析方法的各个步骤。

一种视频分析方法、装置、系统、设备及存储介质

技术领域

[0001] 本申请涉及视频监控技术领域，尤其涉及一种视频分析方法、装置、系统、设备及存储介质。

背景技术

[0002] 视频监控是安全防范系统的重要组成部分，随着视频监控技术的发展，视频摄像机已经被广泛用来对各种环境、区域和场所进行实时监控。视频监控的核心是视频分析，即
对视频摄像机采集的视频进行分析，视频分析的目的在于，确定视频摄像机的监控区域是
否发生了目标事件，监控区域发生了目标事件可以为监控区域出现了指定目标、监控区域
中的对象发生了指定行为等。一旦视频摄像机的监控区域发生了目标事件，则触发视频监
控系统中的报警设备报警。

[0003] 在某些时候，视频摄像机的监控区域会包括多个不同场景，比如门口、室内、楼道等，不同的场景通常会对应有不同的视频分析目标，比如，对于场景A，需要分析视频摄像机
针对场景A采集的视频，以确定场景A中是否发生了事件a(比如场景A中是否有人跌倒)，对
于场景B，需要分析视频摄像机针对场景B采集的视频，以确定场景B中是否发生了事件b(比
如是否有人翻越围栏)，而如何根据视频摄像机针对多种场景采集的视频确定对应场景是
否发生了对应的目标事件是目前亟需解决的问题。

发明内容

[0004] 有鉴于此，本申请提供了一种视频分析方法、装置、系统、设备及存储介质，以根据视频摄像机针对某种场景采集的视频确定对应场景是否发生了对应的目标事件，其技术方
案如下：

[0005] 一种视频分析方法，包括：

[0006] 获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

[0007] 利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率，其中，任一场景对应的视频分
析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对
应的目标事件时，摄像机针对该场景采集的图像；

[0008] 根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件。

[0009] 可选的，所述视频分析方法还包括：

[0010] 当所述目标场景中发生了所述目标场景对应的目标事件时，存储目标图像帧序列，和/或，将所述目标图像帧序列和区域指示信息发送至终端；

[0011] 其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧，所述区域指示信息用于指示
所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

[0012] 可选的，预先构建任一场景对应的视频分析规则的过程包括：

[0013] 从该场景对应的样本图像中确定出目标区域，其中，所述目标区域为与该场景对应的目标事件相关的区域；

[0014] 从所述目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集；

[0015] 利用所述角点集构建决策树，将构建的决策树作为该场景对应的视频分析规则。

[0016] 可选的，所述从所述目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集，包括：

[0017] 利用预先构建的角点决策器，确定所述目标区域中的每个像素点是否为角点，以得到由确定出的角点组成的角点集；

[0018] 其中，所述角点决策器以训练集中的训练像素为样本，以所述训练像素对应的像素类别为标签训练得到，一个像素的像素类别为角点或非角点。

[0019] 可选的，构建所述角点决策器的过程包括：

[0020] 从角点决策器的训练图像中获取目标像素点集，其中，所述目标像素点集由所述训练图像中可能包含角点的区域中的像素点组成；

[0021] 根据所述目标像素点集中像素点的亮度，确定所述目标像素点集中每个像素点的像素类别；

[0022] 以所述目标像素点集中像素点对应的信息增益为依据，用所述目标像素点集中的像素和所述目标像素点集中像素对应的像素类别训练角点决策器。

[0023] 可选的，所述根据所述目标像素点集中像素点的亮度，确定所述目标像素点集中每个像素点的像素类别，包括：

[0024] 对于所述目标像素点集中的每个像素点，根据该像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，以得到所述目标像素点集中每个像素点
的像素类别。

[0025] 可选的，所述根据该像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，包括：

[0026] 若该像素点的邻域圆上的四个目标像素点中有至少连续三个目标像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮度
值，则确定该像素点为候选角点，其中，所述四个目标像素为将该像素点的邻域圆四等分的
四个像素点，一像素点对应的第一亮度值为该像素点的亮度值与预设亮度值的和，该像素
点对应的第二亮度值为该像素点的亮度值与所述预设亮度值的差；

[0027] 当该像素点为候选角点时，若该像素点的邻域圆上存在连续预设个像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮度
值，则确定该像素点为角点。

[0028] 可选的，确定所述目标像素点集中一像素点对应的信息增益的过程包括：

[0029] 根据所述目标像素点集中所包含的角点的数量和非角点的数量计算所述目标像素点集的信息熵；

[0030] 获取该像素点对应的三个子向量，并分别确定该像素点对应的三个子向量的信息熵，其中，该像素点对应的三个子向量分别由所述训练图像中该像素点的邻域圆上亮度大
于或等于该像素点对应的第一亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小
于或等于该像素点对应的第二亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小
于所述第一亮度值且大于所述第二亮度值的像素点的像素值组成；

[0031] 根据所述目标像素点集的信息熵和该像素点对应的三个子向量的信息熵，确定该角点对应的信息增益。

[0032] 可选的，所述利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率，包括：

[0033] 从所述目标图像帧中确定出与所述目标场景对应的目标事件可能相关的目标区域；

[0034] 从所述目标图像帧的目标区域中确定角点，以得到由确定出的角点组成的目标角点集；

[0035] 利用所述目标角点集和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率；

[0036] 将所述多个场景分别对应的目标事件中，最大概率对应的目标事件作为从所述目标图像帧中识别到的事件，将所述最大概率作为从所述目标图像帧中识别到的事件对应的
概率。

[0037] 可选的，所述利用所述目标角点集和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，包括：

[0038] 对于所述目标角点集中的每个角点，若该角点不是以其为中心的邻域所包含的角点中的最优角点，则将该角点从所述目标角点集中删除；

[0039] 利用剩余角点组成的角点集合和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率。

[0040] 可选的，确定一个角点是否为以其为中心的邻域所包含的角点中的最优角点，包括：

[0041] 确定以该角点为中心的邻域所包含的所有角点分别对应的目标值，其中，一个角点对应的目标值为该角点的邻域圆上各像素点分别与该角点的像素值差的绝对值之和；

[0042] 若该角点对应的目标值不是确定出的所有目标值中的最大值，则确定该角点不是以其为中心的邻域所包含的角点中的最优角点，否则，确定该角点是以其为中心的邻域所
包含的角点中的最优角点。

[0043] 可选的，所述根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件，包括：

[0044] 若所述识别到的事件为所述目标场景对应的目标事件，且所述识别到的事件对应的概率大于预设的概率阈值，则确定所述目标场景中发生了所述目标场景对应的目标事
件。

[0045] 一种视频分析装置，包括：图像帧获取模块、事件识别模块和事件判别模块；

[0046] 所述图像帧获取模块，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

[0047] 所述事件识别模块，用于利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率，其
中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的
样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像；

[0048] 所述事件判别模块，用于根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件。

[0049] 一种视频分析系统，包括：配置单元、存储单元和分析单元；

[0050] 所述配置单元，用于预先构建多个场景分别对应的视频分析规则，其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该
场景中发生对应的目标事件时，摄像机针对该场景采集的图像；

[0051] 所述存储单元，用于存储所述多个场景分别对应的视频分析规则；

[0052] 所述分析单元，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；利用所述多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识
别，获得识别到的事件以及所述识别到的事件对应的概率；根据所述识别到的事件以及所
述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事
件。

[0053] 可选的，所述视频分析系统还包括：报警管理单元；

[0054] 所述报警管理单元，用于当所述目标场景中发生了所述目标场景对应的目标事件时，向报警设备发送报警指令，并存储目标图像帧序列；

[0055] 其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧。

[0056] 可选的，所述视频分析系统还包括：监控管理单元；

[0057] 所述监控管理单元，用于将所述目标图像帧序列和区域指示信息发送至终端，以使所述终端展示所述目标图像帧序列，并在所述目标图像帧序列中展示所述区域指示信息
所指示的区域的检测框和跟随框；

[0058] 其中，所述区域指示信息用于指示所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

[0059] 一种视频分析设备，包括：存储器和处理器；

[0060] 所述存储器，用于存储程序；

[0061] 所述处理器，用于执行所述程序，实现上述任一项所述的视频分析方法的各个步骤。

[0062] 一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现上述任一项所述的视频分析方法的各个步骤。

[0063] 经由上述方案可知，本申请提供的视频分析方法中，由于多个场景分别对应的视频分析规则从多个不同场景分别对应的样本图像中获得，而任一场景对应的样本图像为该
场景中发生对应的目标事件时，摄像机针对该场景采集的图像，因此，根据待分析的目标图
像帧和多个场景分别对应的视频分析规则可确定出目标场景中可能发生的事件以及发生
该事件的概率，进而可根据目标场景中可能发生的事件以及发生该事件的概率，确定目标
场景中是否发生了对应的目标事件。本申请提供的视频分析方法，能够根据某个场景的待
分析图像帧和预先构建的多个场景分别对应的视频分析规则，自动确定出该场景是否发生
了对应的目标事件，该视频分析方法可实现多个不同场景所对应目标事件的检测。

附图说明

[0064] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本
发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据
提供的附图获得其他的附图。

[0065] 图1为本申请实施例提供的视频分析方法的流程示意图；

[0066] 图2为本申请实施例提供的构建一场景对应的视频分析规则的流程示意图；

[0067] 图3为本申请实施例提供的构建角点决策器的流程示意图；

[0068] 图4为本申请实施例提供的一像素点的邻域圆的示意图；

[0069] 图5为本申请实施例提供的利用预先构建的多个场景分别对应的视频分析规则，对目标图像帧进行事件识别，获得识别到的事件以及识别到的事件对应的概率的流程示意
图；

[0070] 图6为本申请实施例提供的视频分析装置的结构示意图；

[0071] 图7为本申请实施例提供的视频分析系统的结构示意图；

[0072] 图8为本申请实施例提供的视频分析设备的结构示意图。

具体实施方式

[0073] 为了能够实现对多种不同场景对应的目标事件进行检测，本案发明人进行了研究，起初的思路是:预先根据场景，为针对对应场景采集视频的摄像机配置对应场景的视频
分析规则，当需要对摄像机针对某个场景采集的视频进行分析时，利用对应的视频分析规
则进行分析。

[0074] 然而，需要分析的场景可能不止一个，针对每个场景采集视频的摄像机可能也不止一个，为多个场景的多个摄像机人工配置视频分析规则的工作量较大，且人工配置可能
产生遗漏或差错，会影响后续的视频分析效果。

[0075] 鉴于上述思路存在的问题，本案发明人进一步进行研究，最终提供了一种视频分析方法，该方法不但能够对多种不同场景分别对应的目标事件进行检测分析，而且不需要
人工为采集每种场景视频的摄像机配置视频分析规则，该方法可应用于单个服务器，也可
以应用于多个服务器，还可以应用于服务器集群，接下来通过下述实施例对本申请提供的
视频分析方法进行介绍。

[0076] 第一实施例

[0077] 请参阅图1，示出了本实施例提供的视频分析方法的流程示意图，该方法可以包括：

[0078] 步骤S101：获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧。

[0079] 可选的，指定摄像机可以为普通摄像机，也可以为PTZ摄像机，其中，普通摄像机的监控范围是固定的，而PTZ摄像机相比于普通摄像机具有可变视角和可变焦距等优势，其监
控范围更大。另外，本实施例中的指定摄像机可以为一个，也可以为多个，即，对于目标场景
而言，可采用一个摄像机对其进行监控，也可以采用多个摄像机进行监控。

[0080] 步骤S102：利用预先构建的多个场景分别对应的视频分析规则，对目标图像帧进行事件识别，获得识别到的事件以及识别到的事件对应的概率。

[0081] 其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像。通
过一场景对应的视频分析规则能够确定某个场景中所发生的事件为该场景对应的目标事
件的概率。

[0082] 示例性的，多个场景分别为需要进行“人跌倒”检测的场景A、需要进行“人跳跃”检测的场景B，则预先获取场景A对应的大量样本图像，并且，获取场景B对应的大量样本图像，
其中，场景A对应的样本图像为，当场景A中发生“人跌倒”事件时，摄像机针对场景A采集的
图像，同样的，场景B对应的样本图像为，当场景B中发生“人跳跃”这一事件时，摄像机针对
场景B采集的图像。需要说明的是，场景A对应的视频分析规则从场景A对应的样本图像中学
习得到，利用场景A对应的视频分析规则能够分析出某个场景发生的事件为场景A对应的目
标事件(即“人跌倒”事件)的概率，同样的，场景B对应的视频分析规则从场景B对应的样本
图像中学习得到，利用场景B对应的视频分析规则能够分析出某个场景发生的事件为场景B
对应的目标事件(即“人跳跃”事件)的概率。

[0083] 另外，需要说明的是，多个场景分别对应的视频分析规则根据当前的监控需求，若后续增设了新的场景，则可获取新场景对应的大量样本图像，利用新场景对应的大量样本
图像构建新场景对应的视频规则，同样的，新场景对应的样本图像为当新场景中发生其对
应的目标事件时，摄像机针对新场景采集的图像。

[0084] 步骤S103：根据识别到的事件以及识别到的事件对应的概率，确定目标场景中是否发生了目标场景对应的目标事件。

[0085] 具体的，若识别到的事件为目标场景对应的目标事件，且识别到的事件对应的概率大于预设的概率阈值，则确定目标场景中发生了目标场景对应的目标事件。

[0086] 示例性的，目标场景为需要进行“人跌倒”检测的场景，目标场景对应的目标事件为“人跌倒”，假设识别到的事件为“人跌倒”，识别到的事件对应的概率为95％，由于概率
95％大于预设的概率阈值90％，因此，确定目标场景中发生了“人跌倒”事件。

[0087] 本实施例提供的视频分析方法中，由于多个场景分别对应的视频分析规则从多个不同场景分别对应的样本图像中学习得到，而任一场景对应的样本图像为该场景中发生对
应的目标事件时，摄像机针对该场景采集的图像，因此，根据待分析的目标图像帧和多个场
景分别对应的视频分析规则可确定出目标场景中可能发生的事件以及发生该事件的概率，
进而可根据目标场景中可能发生的事件以及发生该事件的概率，确定目标场景中是否发生
了对应的目标事件。本申请提供的视频分析方法，能够根据某个场景的待分析图像帧和预
先构建的多个场景分别对应的视频分析规则，自动确定出该场景是否发生了对应的目标事
件，该视频分析方法可实现多个不同场景所对应目标事件的检测分析，另外，本申请提供的
视频分析方法不需要人工对摄像机进行视频分析规则的配置，由于不需要人工参与，因此，
能够避免人工参与所带来的问题。

[0088] 第二实施例

[0089] 由上述实施例一提供的视频分析方法可知，在对待分析的目标图像帧进行分析时，需要利用预先构建的多个场景分别对应的视频分析规则，为此，本实施例对构建多个场
景分别对应的视频分析规则的过程进行介绍。由于每个场景对应的视频分析规则的构建方
式相同，因此，本实施例以对一个场景对应的视频分析规则为例对构建过程进行介绍。

[0090] 请参阅图2，示出了构建一场景A对应的视频分析规则的流程示意图，可以包括：

[0091] 步骤S201：从场景A对应的样本图像中确定出目标区域.

[0092] 其中，目标区域为与场景A对应的目标事件a相关的区域，具体的，与场景A对应的目标事件a相关的区域为场景A对应的样本图像中目标事件a所涉及的对象所在的区域。示
例性的，场景A为需要进行“人跌倒”检测的场景，场景A对应的目标事件为“人跌倒”，那么，
场景A对应的样本图像中的目标区域即为人所在的区域。

[0093] 可选的，可采用边缘检测算法对场景A对应的样本图像进行边缘检测，具体的，对场景A对应的目标事件a所涉及的对象所在的区域进行边缘检测，然后利用多边形近似改善
检测出的边缘，以得到一个封闭轮廓，该封闭轮廓中的区域即为目标区域。

[0094] 步骤S202：从目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集。

[0095] 在一种可能的实现方式中，可利用预先构建的角点决策器确定目标区域中的每个像素点是否为角点，以得到由确定出的角点组成的角点集。其中，角点决策器以训练集中的
训练像素为样本，以训练像素对应的像素类别为标签训练得到，一个像素的像素类别为角
点或非角点。

[0096] 步骤S203：利用角点集构建决策树，将构建的决策树作为场景A对应的视频分析规则。

[0097] 由于场景A对应的视频分析规则根据角点集构建，因此，获取角点集的过程至关重要，上述内容提到可利用角点决策器获取角点集，以下对构建角点决策器的过程进行介绍。

[0098] 请参阅图3，示出了构建角点决策器的流程示意图，可以包括：

[0099] 步骤S301：从角点决策器的训练图像中获取目标像素点集。

[0100] 其中，目标像素点集由角点决策器的训练图像中可能包含角点的区域中的像素点组成。在一种可能的实现方式中，目标像素点集可以包括“可能包含角点的区域”中的所有
像素点，为了降低运算量，在另一种可能的实现方式中，目标像素点集可以包括针对“可能
包含角点的区域”从多个不同方向选取的像素点。

[0101] 步骤S302：根据目标像素点集中像素点的亮度，确定目标像素点集中每个像素点的像素类别。

[0102] 具体的，根据目标像素点集中像素点的亮度，确定目标像素点集中每个像素点的像素类别的过程可以包括：对于目标像素点集中的每个像素点，根据该像素点的亮度以及
该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，以得到目标像素点集中每
个像素点的像素类别。

[0103] 其中，一个像素点的邻域圆为以该像素点为圆心，预设个像素点为半径的圆，请参阅图4，示出了像素点p的邻域圆的示意图，图4中p的邻域圆以p为圆心，以3个像素点为半
径，p的邻域圆上有16个像素点。

[0104] 在本实施例中，根据一像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点的实现方式有多种：

[0105] 在一种可能的实现方式中，可判断该像素点的邻域圆上是否存在连续N个像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第
二亮度值，若是，则确定该像素点为角点，若否，则确定该像素点不是角点。需要说明的时，
一像素点对应的第一亮度值为该像素点的亮度值与预设亮度值t的和，该像素点对应的第
二亮度值为该像素点的亮度值与预设亮度值t的差。

[0106] 以图4中的像素点p为例：像素点p的邻域圆上有16个像素，假设这16个像素点中存在连续N个像素点的亮度值均大于或等于Ip+t，或者这16个像素点中存在连续N个像素点的
亮度值均小于或等于Ip‑t，则确定像素点p为角点，否则，确定像素点p不为角点，其中，Ip为
像素点p的亮度值。

[0107] 需要说明的是，若一个像素点为角点，那么其邻域圆上至少有3/4像素点应满足亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮
度值，从这点出发，为了能够更快速地进行角点判别，本实施例提供了另一种较优选的实现
方式：

[0108] 可先判断该像素点的邻域圆上的四个目标像素点中是否有至少连续三个目标像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应
的第二亮度值，若是，则确定该像素点为候选角点，否则，确定该像素点不是角点；若该像素
点为候选角点，进一步判断该像素点的邻域圆上是否存在连续N个像素点的亮度值均大于
或等于该像素点对应的第一亮度值，或者均小于或等于该像素点对应的第二亮度值，若是，
则确定该像素点为角点，若否，则确定该像素点不是角点。其中，一个像素点的邻域圆上的
四个目标像素点可以为将该像素点的邻域圆四等分的四个像素点。

[0109] 同样以图4中的像素点p为例：像素点p的邻域圆上有16个像素点，16个像素中的四个目标像素可以为位置1、9、5、13的像素点，如果这四个像素点中有至少连续三个像素点的
像素值均大于或等于Ip+t，或者均小于或等于Ip‑t，则确定像素点p为候选角点，否则，确定
像素点p不为角点，假设像素点p为候选角点，则进一步判断其邻域圆的16个像素中是否存
在连续N个像素点的亮度值均大于或等于Ip+t，或者均小于或等于Ip‑t，若是，则确定像素
点p为角点，否则确定像素点p不为角点。需要说明的是，N的取值可根据后续角点决策器的
训练情况进行调整，直至达到最优。

[0110] 步骤S303：以目标像素点集中像素点对应的信息增益为依据，用目标像素点集中的像素和目标像素点集中像素对应的像素类别训练角点决策器。

[0111] 可选的，可利用ID3算法训练角点决策器。

[0112] 其中，目标像素点集中一像素点对应的信息增益可通过如下方式确定：

[0113] 步骤a1、根据目标像素点集中所包含的角点的数量和非角点的数量计算目标像素点集的信息熵。

[0114] 其中，根据目标像素点集中各像素对应的像素类别确定目标像素点集中所包含的角点的数量和非角点的数量。

[0115] 具体的，可根据目标像素点集中所包含的角点的数量和非角点的数量，利用下式确定目标像素点集的信息熵：

[0116]

[0117] 其中，X为目标像素点集，H(X)为目标像素点集的信息熵，c为目标像素点集X中角点的数量，为目标像素点集X中非角点的数量。

[0118] 步骤a2、获取该像素点对应的三个子向量，并分别确定该像素点对应的三个子向量的信息熵。

[0119] 其中，该像素点对应的三个子向量分别由该像素点的邻域圆上亮度大于或等于该像素点对应的第一亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小于或等于该
像素点对应的第二亮度值的像素点的像素值组成、该像素点的邻域圆上亮度小于第一亮度
值且大于第二亮度值的像素点的像素值组成。可选的，一个像素点的像素值可以由该像素
点的亮度值表征。

[0120] 步骤a3、根据目标像素点集的信息熵和该像素点对应的三个子向量的信息熵，确定该像素点对应的信息增益。

[0121] 具体的，可根据目标像素点集的信息熵和该像素点对应的三个子向量的信息熵，利用下式确定该像素点对应的信息增益：

[0122] Gain＝H(X)‑H(vd)‑H(vs)‑H(vb) (2)

[0123] 其中，Gain该角点对应的信息增益，vd、vs和vb为该角点对应的三个子向量，H(vd)、H(vs)和H(vb)为该角点对应的三个子向量的信息熵。

[0124] 第三实施例

[0125] 本实施例对上述实施例中“利用预先构建的多个场景分别对应的视频分析规则，对目标图像帧进行事件识别，获得识别到的事件以及识别到的事件对应的概率”进行介绍。

[0126] 请参阅图5，示出了利用预先构建的多个场景分别对应的视频分析规则，对目标图像帧进行事件识别，获得识别到的事件以及识别到的事件对应的概率的流程示意图，可以
包括：

[0127] 步骤S501：从目标图像帧中确定出与目标场景对应的目标事件可能相关的目标区域。

[0128] 从目标图像帧中确定目标区域的过程与上述从样本图像中确定目标区域的过程相同，本实施例在此不做赘述。

[0129] 步骤S502：从目标图像帧的目标区域中确定角点，以得到由确定出的角点组成的目标角点集。

[0130] 从目标图像帧的目标区域中确定角点过程与上述从样本图像中的目标区域确定角点的过程相同，本实施例在此不做赘述。

[0131] 步骤S503：利用目标角点集和多个场景分别对应的视频分析规则，确定目标场景发生的事件为多个场景中每个场景对应的目标事件的概率。

[0132] 示例性的，多个场景分别为需要进行“人跌倒”检测的场景A、需要进行“人跳跃”检测的场景B，则利用目标角点集和场景A对应的视频分析规则，可确定目标场景中发生的事
件为“人跌倒”这一事件的概率PA，利用目标角点集和场景B对应的视频分析规则可确定目
标场景中发生的事件为“人跌倒”这一事件的概率PB。

[0133] 通常情况下，目标角点集中包括很多角点，在一种可能的实现方式中，可利用目标角点集中的所有角点进行事件分析，在另一种可能的实现方式中，为了降低运算量，可从目
标角点集中选取部分较优的角点，用选取出的角点进行事件分析。

[0134] 具体的，从目标角点集中选取较优角点的过程可以包括：对于目标角点集中的每个角点，判断该角点是否为以其为中心的邻域所包含的角点中的最优角点，若不是，则将该
角点从目标角点集中删除，若是，将该角点保留。

[0135] 其中，判断一角点是否为以其为中心的邻域所包含的角点中的最优角点的过程包括：确定以该角点为中心的邻域所包含的所有角点分别对应的目标值，若该角点对应的目
标值不是确定出的所有目标值中的最大值，则确定该角点不是以其为中心的邻域所包含的
角点中的最优角点，否则，确定该角点是以其为中心的邻域所包含的角点中的最优角点。其
中，一个角点对应的目标值为该角点的邻域圆上各像素点分别与该角点的像素值差的绝对
值之和。

[0136] 步骤S504：将多个场景分别对应的目标事件中，最大概率对应的目标事件作为从目标图像帧中识别到的事件，最大概率作为从目标图像帧中识别到的事件对应的概率。

[0137] 假设多个场景分别为A、B、C、D，目标场景发生的事件为场景A对应的目标事件a的概率为5％，目标场景发生的事件为场景B对应的目标事件b的概率为10％，，目标场景发生
的事件为场景C对应的目标事件c的概率为3％，目标场景发生的事件为场景D对应的目标事
件d的概率为95％，则将场景D对应的目标事件d作为最终识别到的事件，95％即为最终识别
到的事件对应的概率。

[0138] 第四实施例

[0139] 本实施例提供了另一种视频分析方法，该视频分析方法除了包括实施例一中的步骤S101～步骤S103外，还可以包括：当目标场景发生了目标场景对应的目标事件时，向报警
设备发生报警指令，以使报警设备报警。

[0140] 本实施例提供的视频分析方法还可以包括：当目标场景发生了目标场景对应的目标事件时，存储目标图像帧序列。

[0141] 其中，目标图像帧序列包括目标图像帧，以及目标图像帧之前的至少一个图像帧和/或目标图像帧之后的至少一个图像帧。优选的，目标图像帧序列包括目标图像帧、目标
图像帧之前的至少一个图像帧以及目标图像帧之前的至少一个图像帧。

[0142] 可以理解的是，若目标图像帧与目标场景发生的目标事件有关，那么其前后图像帧很可能也与目标场景发生的目标事件有关，为了后续能够使相关人员获知产生报警的事
件，本实施例可将目标图像帧、目标图像帧之前的至少一个图像帧以及目标图像帧之前的
至少一个图像帧进行存储。

[0143] 可选的，在存储目标图像帧序列时，还可一并存储采集目标图像帧序列的摄像机的标识以及目标图像帧序列的采集时间等。

[0144] 可选的，本实施例提供的视频分析方法还可以包括：将目标图像帧序列和区域指示信息发送至终端。其中，区域指示信息用于指示目标图像帧序列的各图像帧中发生目标
场景对应的目标事件的区域。

[0145] 当终端接收到目标图像帧序列和区域指示信息时，展示目标图像帧序列，并在目标图像帧序列中展示区域指示信息所指示的区域的检测框和跟随框，以便监控人员能够较
快速直观地获知目标场景所发生的目标事件的情况。

[0146] 第五实施例

[0147] 本实施例提供了与上述实施例提供的视频分析方法对应的视频分析装置，请参阅图6，示出了该视频分析装置的结构示意图，可以包括：图像帧获取模块601、事件识别模块
602和事件判别模块603。

[0148] 图像帧获取模块601，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧。

[0149] 事件识别模块602，用于利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率。

[0150] 其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像；

[0151] 事件判别模块603，用于根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件。

[0152] 可选的，本实施例提供的视频分析装置还可以包括：视频存储模块和/或视频发送模块。

[0153] 视频存储模块，用于当目标场景中发生了目标场景对应的目标事件时，存储目标图像帧序列。其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的
至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧。

[0154] 视频发送模块，用于当目标场景中发生了目标场景对应的目标事件时，将所述目标图像帧序列和区域指示信息发送至终端。其中，区域指示信息用于指示所述目标图像帧
序列的各图像帧中发生所述目标场景对应的目标事件的区域。

[0155] 可选的，本实施例提供的视频分析装置可以包括：视频分析规则构建模块。视频分析规则构建模块可以包括：目标区域确定模块、角点确定模块和决策树构建模块。

[0156] 目标区域确定模块，用于从该场景对应的样本图像中确定出目标区域。其中，所述目标区域为与该场景对应的目标事件相关的区域。

[0157] 角点确定模块，用于从所述目标区域所包含的像素点中确定角点，以得到由确定出的角点组成的角点集。

[0158] 决策树构建模块，用于利用所述角点集构建决策树，将构建的决策树作为该场景对应的视频分析规则。

[0159] 可选的，角点确定模块，具体用于利用预先构建的角点决策器，确定所述目标区域中的每个像素点是否为角点，以得到由确定出的角点组成的角点集。其中，所述角点决策器
以训练集中的训练像素为样本，以所述训练像素对应的像素类别为标签训练得到，一个像
素的像素类别为角点或非角点。

[0160] 可选的，本实施例提供的视频分析装置可以包括：角点决策器构建模块。角点决策器构建模块包括：目标像素点集获取模块、像素类别确定模块和角点决策器训练模块。

[0161] 目标像素点集获取模块，用于从角点决策器的训练图像中获取目标像素点集，其中，所述目标像素点集由所述训练图像中可能包含角点的区域中的像素点组成；

[0162] 像素类别确定模块，用于根据所述目标像素点集中像素点的亮度，确定所述目标像素点集中每个像素点的像素类别。

[0163] 角点决策器训练模块，用于以所述目标像素点集中像素点对应的信息增益为依据，用所述目标像素点集中的像素和所述目标像素点集中像素对应的像素类别训练角点决
策器。

[0164] 可选的，像素类别确定模块，具体用于对于所述目标像素点集中的每个像素点，根据该像素点的亮度以及该像素点的邻域圆上像素点的亮度，确定该像素点是否为角点，以
从所述目标像素点集中获得所有的角点。

[0165] 可选的，像素类别确定模块包括：候选角点确定子模块和角点确定子模块。

[0166] 候选角点确定子模块，用于判断该像素点的邻域圆上的四个目标像素点中是否有至少连续三个目标像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于
或等于该像素点对应的第二亮度值，若是，则确定该像素点为候选角点。

[0167] 其中，所述四个目标像素为将该像素点的邻域圆四等分的四个像素点，一像素点对应的第一亮度值为该像素点的亮度值与预设亮度值的和，该像素点对应的第二亮度值为
该像素点的亮度值与所述预设亮度值的差。

[0168] 角点确定子模块，用于当该像素点为候选角点时，判断该像素点的邻域圆上存在连续预设个像素点的亮度值均大于或等于该像素点对应的第一亮度值，或者均小于或等于
该像素点对应的第二亮度值，若是，则确定该像素点为角点。

[0169] 可选的，上述的角点决策器训练模块包括：用于确定目标像素点集中像素点对应的信息增益的信息增益确定子模块。

[0170] 信息增益确定子模块，在确定目标像素点集中一像素点对应的信息增益时，具体用于

[0171] 根据所述目标像素点集中所包含的角点的数量和非角点的数量计算所述目标像素点集的信息熵；获取该像素点对应的三个子向量，并分别确定该像素点对应的三个子向
量的信息熵，其中，该像素点对应的三个子向量分别由所述训练图像中该像素点的邻域圆
上亮度大于或等于该像素点对应的第一亮度值的像素点的像素值组成、该像素点的邻域圆
上亮度小于或等于该像素点对应的第二亮度值的像素点的像素值组成、该像素点的邻域圆
上亮度小于所述第一亮度值且大于所述第二亮度值的像素点的像素值组成；根据所述目标
像素点集的信息熵和该像素点对应的三个子向量的信息熵，确定该角点对应的信息增益。

[0172] 可选的，上述的事件识别模块包括：目标区域确定子模块、目标角点集确定子模块和事件识别子模块。

[0173] 目标区域确定子模块，用于从所述目标图像帧中确定出与所述目标场景对应的目标事件可能相关的目标区域。

[0174] 目标角点集确定子模块，用于从所述目标图像帧的目标区域中确定角点，以得到由确定出的角点组成的目标角点集。

[0175] 事件识别子模块，用于利用所述目标角点集和所述多个场景分别对应的视频分析规则，确定所述目标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率，
将所述多个场景分别对应的目标事件中，最大概率对应的目标事件作为从所述目标图像帧
中识别到的事件，所述最大概率作为从所述目标图像帧中识别到的事件对应的概率。

[0176] 可选的，上述的事件识别子模块，具体对于所述目标角点集中的每个角点，若该角点不是以其为中心的邻域所包含的角点中的最优角点，则将该角点从所述目标角点集中删
除，利用剩余角点组成的角点集合和所述多个场景分别对应的视频分析规则，确定所述目
标场景发生的事件为所述多个场景中每个场景对应的目标事件的概率。

[0177] 可选的，上述的事件识别子模块，在确定一个角点是否为以其为中心的邻域所包含的角点中的最优角点时，具体用于确定以该角点为中心的邻域所包含的所有角点分别对
应的目标值，若该角点对应的目标值不是确定出的所有目标值中的最大值，则确定该角点
不是以其为中心的邻域所包含的角点中的最优角点，否则，确定该角点是以其为中心的邻
域所包含的角点中的最优角点。其中，一个角点对应的目标值为该角点的邻域圆上各像素
点分别与该角点的像素值差的绝对值之和。

[0178] 可选的，上述的事件判别模块，具体用于若所述识别到的事件为所述目标场景对应的目标事件，且所述识别到的事件对应的概率大于预设的概率阈值，则确定所述目标场
景中发生了所述目标场景对应的目标事件。

[0179] 本申请提供的视频分析装置，能够根据某个场景的待分析图像帧和预先构建的多个场景分别对应的视频分析规则，自动确定出该场景是否发生了对应的目标事件，该视频
分析方法可实现多个不同场景所对应目标事件的检测。

[0180] 第六实施例

[0181] 本实施例提供了一种视频分析系统，请参阅图7，使出了该视频分析系统的结构示意图，可以包括：配置单元701、存储单元702和分析单元703。

[0182] 配置单元701，用于预先构建多个场景分别对应的视频分析规则。

[0183] 其中，任一场景对应的视频分析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对应的目标事件时，摄像机针对该场景采集的图像。

[0184] 配置单元701，还用于配置指定场景对应的视频分析规则的启用时间。

[0185] 存储单元702，用于存储所述多个场景分别对应的视频分析规则；

[0186] 分析单元703，用于获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；利用所述多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，
获得识别到的事件以及所述识别到的事件对应的概率；以及根据所述识别到的事件以及所
述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事
件。

[0187] 分析单元703对目标图像帧进行事件分析的过程可参见上述实施例提供的视频分析方法的具体实现过程，本实施例在此不做赘述。

[0188] 可选的，本实施例提供的视频分析系统还可以包括：报警管理单元704。

[0189] 报警管理单元704，用于当所述目标场景中发生了所述目标场景对应的目标事件时，向报警设备发送报警指令，并存储目标图像帧序列。

[0190] 其中，所述目标图像帧序列包括所述目标图像帧，以及所述目标图像帧之前的至少一个图像帧和/或所述目标图像帧之后的至少一个图像帧。

[0191] 可选的，报警管理单元704在存储目标图像帧序列时，还可将目标图像帧序列的采集事件、采集目标图像帧序列的摄像机的标识一并存储。

[0192] 可选的，本实施例提供的视频分析系统还可以包括：监控管理单元705。

[0193] 监控管理单元705，用于将所述目标图像帧序列和区域指示信息发送至终端，以使所述终端展示所述目标图像帧序列，并在所述目标图像帧序列中展示所述区域指示信息所
指示的区域的检测框和跟随框。

[0194] 其中，所述区域指示信息用于指示所述目标图像帧序列的各图像帧中发生所述目标场景对应的目标事件的区域。

[0195] 另外，监控管理单元，还用于添加、禁用或者删除摄像机，还可以接收针对指定摄像机的视频分析指令，以通知分析单元对指定摄像机采集的图像帧进行分析。

[0196] 本实施例提供的视频分析系统，能够根据摄像机针对某个场景采集的待分析图像帧和预先构建的多个场景分别对应的视频分析规则，自动确定出该场景是否发生了对应的
目标事件，在该场景发生了对应的目标事件时，可触发报警装置报警，并且，本实施例提供
的视频分析系统还可将该场景发生对应目标事件的相关图像帧序列发生至终端显示，在显
示时还可使终端在图像帧序列的各图像帧中显示检测框和跟随框，以便用户能够快速直观
地获知目标事件的情况。

[0197] 第七实施例

[0198] 本申请实施例还提供了一种视频分析设备，请参阅图8，示出了该视频分析设备的结构示意图，该视频分析设备可以包括：至少一个处理器801，至少一个通信接口802，至少
一个存储器803和至少一个通信总线804；

[0199] 在本申请实施例中，处理器801、通信接口802、存储器803、通信总线804的数量为至少一个，且处理器801、通信接口802、存储器803通过通信总线804完成相互间的通信；

[0200] 处理器801可能是一个中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电
路等；

[0201] 存储器803可能包含高速RAM存储器，也可能还包括非易失性存储器(non‑volatile memory)等，例如至少一个磁盘存储器；

[0202] 其中，存储器存储有程序，处理器可调用存储器存储的程序，所述程序用于：

[0203] 获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

[0204] 利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率，其中，任一场景对应的视频分
析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对
应的目标事件时，摄像机针对该场景采集的图像；

[0205] 根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件。

[0206] 可选的，所述程序的细化功能和扩展功能可参照上文描述。

[0207] 第八实施例

[0208] 本申请实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的程序，所述程序用于：

[0209] 获取指定摄像机对其所监控的目标场景采集的图像帧，作为目标图像帧；

[0210] 利用预先构建的多个场景分别对应的视频分析规则，对所述目标图像帧进行事件识别，获得识别到的事件以及所述识别到的事件对应的概率，其中，任一场景对应的视频分
析规则从该场景对应的样本图像中学习得到，一个场景对应的样本图像为该场景中发生对
应的目标事件时，摄像机针对该场景采集的图像；

[0211] 根据所述识别到的事件以及所述识别到的事件对应的概率，确定所述目标场景中是否发生了所述目标场景对应的目标事件。

[0212] 最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作
之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意
在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那
些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者
设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排
除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

[0213] 本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

[0214] 对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的
一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明
将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。

一种视频分析方法、装置、系统、设备及存储介质转让专利

申请号 : CN202010182741.1

文献号 : CN111401239B

文献日 : 2021-04-20

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 管睿 , 支洪平

申请人 : 科大讯飞(苏州)科技有限公司

摘要 :

权利要求 :

说明书 :