一种基于大量真实人群运动视频的人群运动仿真方法转让专利
申请号 : CN202110735986.7
文献号 : CN113536996B
文献日 : 2022-04-15
发明人 : 贾鹏 , 王宗尧 , 匡海波 , 赵宇哲 , 仝淑芳 , 姚晋玮 , 杨彦博 , 万民
申请人 : 大连海事大学
摘要 :
权利要求 :
1.一种基于大量真实人群运动视频的人群运动仿真方法,包括如下步骤:步骤1、拍摄真实人群运动视频,将视频分帧并保存成连续高清图像,生成每张图像对应的人群密度图,并对每张密度图中的每个个体进行精准定位,得到每个个体在图像中的精确位置;
步骤2、将每个个体在不同图像中的位置关联起来,形成一条完整的运动轨迹,并提取运动轨迹数据;
步骤3、对运动轨迹数据进行量化,计算数据相关性,选择训练数据、数据标签;
步骤4、搭建深度卷积神经网络,输入步骤3处理后的运动轨迹数据进行训练,以学习人群运动行为;
步骤5、以图像大小设置二维空间,在二维空间中随机放置多个模拟个体,测试深度卷积神经网络的预测效果,调整参数进行仿真,并绘制人群运动轨迹;
所述步骤3对运动轨迹数据进行量化包括,步骤3a:获取个体g、个体邻居Ng,个体运动速度矢量为[ug,vg]、个体邻居运动矢量为[uj,vj],j∈Ng,j=1,2,…,n,步骤3b:计算个体g到其邻居的相对位置矢量,公式为(7)、(8),dxj=xj‑xg (7)
dyj=yj‑yg (8)
其中,个体g的位置坐标定义为[xg,yg],其邻居坐标定义为[xj,yj],j∈Ng,个体g到其邻居的相对位置矢量为[dxj,dyj],j∈Ng,个体g的邻居集合为Ng,步骤3c:计算个体到其邻居的相对位置矢量的矢量和,公式为(9)、(10),其中,个体g到其邻居的相对位置矢量的矢量和为[drxg,dryg],j∈Ng。
2.根据权利要求1所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,所述步骤1拍摄真实人群运动视频,将视频分帧并保存成连续高清图像,生成每张图像对应的人群密度图,并对每张密度图中的每个个体进行精准定位,得到每个个体在图像中的精确位置,其步骤包括:
步骤1a、用鸟瞰的俯视角度拍摄真实人群视频,将视频的每一帧抽取出来并保存成高清图像;
步骤1b、通过CSRnet卷积神经网络提取每张图像的人群密度图,根据人群密度图中的人群密度取值进行划分,当密度取值低于阈值时,采用脉冲函数卷积高斯核的方式来定义密度图,当人群密度高于阈值时,通过精准估计群体密度函数来定义密度图;
步骤1c、对密度图进行降噪处理,用OpenCV以像素循环的方式来计算密度图中每个点的轮廓,并计算轮廓的质心;
步骤1d、用DBSCAN算法对质心进行聚类,并通过对聚类的质心点的平均值计算,得到每个个体在图像中的精确位置。
3.根据权利要求2所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,步骤1b所述的CSRnet卷积神经网络包括VGG‑16卷积神经网络和空洞卷积层,卷积核大小为3,池化层是2×2,所述脉冲函数卷积高斯核的计算公式为(1),其中,xi为假设标注点的位置,N为图像中头的数量,δ(x‑xi)为冲击函数。
4.根据权利要求2所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,步骤1b所述精准估计群体密度函数的计算公式为(2)、(3)、(4),其中,G(x)为高斯核函数,δi可变且与 成比例,m为与第i个人头近邻人头的数量,表示第i个人头与近邻第j个人头的距离, 为与m个近邻人头的平均距离,β为常量。
5.根据权利要求2所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,步骤1c所述计算轮廓的质心,计算公式为(5)、(6),其中,xi,yi为图像上某一个像素点在x方向和y方向上的坐标,pi为图像上某一个像素点的像素值,n为图像中像素点的个数。
6.根据权利要求1所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,所述步骤2将每个个体在不同图像中的位置关联起来,形成一条完整的运动轨迹,并提取运动轨迹数据,其步骤包括:
步骤2a、采用DBSCAN聚类算法对个体位置进行图像间聚类,得到每个个体的聚类轨迹;
步骤2b、利用Kalman滤波器对聚类轨迹进行平滑处理,得到光滑连续的运动轨迹数据。
7.根据权利要求1所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,所述深度卷积神经网络由输入层、输出层和隐藏层三部分组成,所述输入层包含n个神经元,n为训练数据集的维度值,所述输入层的数据再经过BatchNorm归一化和Reshape数据格式转换传入所述隐藏层,所述输入层和所述输出层之间是所述隐藏层,所述隐藏层包括二维卷积层、LeakyReLU激活层、MaxPooling池化层和Flatten层,所述输出层是全连接层。
8.根据权利要求1所述的一种基于大量真实人群运动视频的人群运动仿真方法,其特征在于,所述步骤4在二维空间随机放置多个模拟个体,测试深度卷积神经网络的预测效果,调整参数进行仿真,并绘制人群运动轨迹,其步骤包括:步骤4a、将模拟个体随机放置在二维空间中,用深度神经网络来预测个体的运动轨迹;
步骤4b、在深度神经网络进行t次连续预测计算,并模拟出人群在虚拟实验平台中的运动轨迹。
说明书 :
一种基于大量真实人群运动视频的人群运动仿真方法
技术领域
背景技术
育场馆、地铁站等大型公共设施的设计等等。
设计是否合理;可以模拟球迷发生冲突、火灾、恐怖袭击等非常规情景下的人群运动轨迹,
辅助建立紧急情况下人员的疏散方案、合理布置消防器材、分配警力;还可以作为场馆管理
人员进行消防、反恐等安全方案预演及培训的辅助工具。与传统方法相比,人群运动轨迹仿
真具有直观、灵活、高效、经济和无人员安全风险等诸多优点。因此,人群运动轨迹仿真的研
究受到了广大学者的关注。
模型之一。该模型采用了分离性、方向性和凝聚性三套简单的规则,建立群体运动仿真模
型。Boids模型采用预定义的规则来实现避免碰撞。但在特定场景中,人类群体不一定需要
避免碰撞,甚至有可能是相互紧密耦合。因此boids模型无法准确模拟人群的分离性。
人群运动的复杂性和不确定性,其模拟难度远远高于按照预定规则的群体运动,无法准确
模拟人群之间的堆挤和碰撞行为。
力和人类心理的混合模型。由于该模型有较多的作用力参数,使各种作用力之间较难平衡,
计算的复杂度高,因此难以得到较平滑的运动轨迹。
法解决的复杂任务。基于Muti‑Agent的人群模型中,每个Agent都可以看作具有自主性、社
会性和主动性的智能体,而且每个智能体可以自主感知其周围环境。但这种模型很难设计
针对不同情况的规则,将这类规则与人类行为联系起来是很难的。
但忽略了因素之间的相互影响。而且人类行为的复杂性较高,无法用简单的规则或数学公
式进行描述。因此,在此基础上进行仿真,无法准确模拟人群运动轨迹。
发明内容
中的精确位置;
在图像中的精确位置,其步骤包括:
定义密度图,当人群密度高于阈值时,通过精准估计群体密度函数来定义密度图;
Reshape数据格式转换传入所述隐藏层,所述输入层和所述输出层之间是所述隐藏层,所述
隐藏层包括二维卷积层、LeakyReLU激活层、MaxPooling池化层和Flatten层,所述输出层是
全连接层。
动轨迹数据,采用深度卷积神经网络对人群行为进行学习,提高了仿真的精准度。
附图说明
明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以
根据这些附图获得其他的附图。
具体实施方式
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
素,又结合了各因素之间的相互影响,提高了仿真的精准度。该方法是通过真实监控视频采
集到的人群运动轨迹数据,对建立的卷积神经网络进行训练。通过深度学习的训练,可以使
深度卷积神经网络学习人群的行为规律。并利用神经网络的预测功能,实时计算人群的位
置,进而模拟出人群运动轨迹。
骤,
景地是大连某商业广场,取景时间是2020年1月1日至1月3日,节假日是人流量高峰期,便于
研究人群的互动行为,取景方式是用鸟瞰的俯视角度拍摄人群视频。将视频的每一帧抽取
出来并保存成高清图像。通过分帧操作可以获取832张连续的高清人群图像,每一帧图像的
分辨率为1280×720,如图2所示。
的可行方法。通过CSRnet卷积神经网络提取每张图像的人群密度图。CSRnet网络的前端是
VGG‑16卷积神经网络。由于卷积层会导致输出的图像变小,因此CSRnet网络的输出是原始
图像1/8的人群密度图。为了获取高分辨率的人群密度图,CSRnet网络的后端采用空洞卷积
层。空洞卷积层在保持高分辨率的同时扩大感知域,可生成高质量的人群分布密度图,如图
3所示。
数需要考虑透视变换。假设每个人头周围的人群是均匀分布的,那么计算与其最近的m个邻
居之间的平均距离可以给出几何失真的合理估计,密度函数公式如下:
度较大时,β=0.3能更好地表征人头大小的特征。
密度图进行降噪处理,如图4所示。
理解成此点处的质量。考虑到图像是二维的,需在x方向和y方向上分别独立地找出质心,即
在x方向上,图像在质心左右两边像素和相等,在y方向上,图像在质心的上下两边像素和相
等。计算公式如下:
些质心进行聚类,并通过对聚类的质心点的平均值计算,得到每个个体在图像中的精确位
置,如图6所示。
类,如果一个对象在其半径Eps内含有超过MmPts数目的点,则该对象为核心点。通俗地讲,
核心点对应稠密区域内部的点,边界点对应稠密区域边缘的点,而噪音点对应稀疏区域中
的点。
离的差值即密度变化,再将这些差值求和,即计算所有点的密度变化之和,找出其中密度变
化之和的最小值,此时,对应的(k+1)最近点平均距离最能反映各点的密度层次,所以取此
时的k+1的值作为k的值,即MinPts的值,此处为3。
据是由每个个体的运动轨迹组成。虽然每个个体的位置可以按照图像的顺序逐个定位,但
是将每个人在不同图像中的位置关联起来,并形成一条完整的轨迹难度很大。因此,本发明
中使用DBSCAN聚类算法对个体位置进行图像间聚类,此时,以时间概念为出发点,将MinPts
定为2,从而获取人群的轨迹数据。
方向取值范围是0~720。Frame轴作为时间轴,代表每一个图像的人群定位数据。群体中的
个体在图像间的运动幅度较小,通常会小于10像素。而在同一图像中人与人之间的距离较
大,通常在20‑100像素之间。因此可以再一次利用DBSCAN算法来聚类人群个体的轨迹。图7
即DBSCAN的聚类结果。
群轨迹数据。由图可知DBSCAN算法可以有效地提取人群轨迹数据。通过Kalman滤波可以获
取光滑连续的人群轨迹数据。
据中生成并选取合适的训练数据。通过对人群轨迹聚类处理,本实施例共获取24000条人群
个体的轨迹数据。通过对轨迹数据的数据相关性分析,提取数据中相关性最大的数据属性,
并利用选取的数据进行深度学习。
属性的相关系数。相关系数越高,说明对应数据属性之间的相关性越高。
量定义为[uj,vj](j∈Ng,j=1,2,…,n)。个体g到其邻居的相对位置矢量为[dxj,dyj](j∈
Ng)。如果把个体g的位置坐标定义为[xg,yg],其邻居坐标定义为[xj,yj](j∈Ng),则[dxj,
dyj]的计算公式如下:
签,(uj,vj)以及(drxg,dryg)定义为训练数据。这一定义的目的是使深度神经网络可以通过
给定的(uj,vj)以及(drxg,dryg)推测出每个个体的运动速度,进而模拟出人群的互动行为。
ug,vg 个体运动速度矢量(数据标签)
uj,vj(j∈Ng) 个体邻居运动速度矢量
drxg,dryg(j∈Ng) 邻居相对距离矢量和
0.31。另外,个体的速度与邻居相对距离矢量和(drxg,dryg)呈现弱相关性,相关系数可以达
到0.16,因此,这10个数据属性将作为神经网络训练数据集对神经网络进行深度学习。个体
的速度矢量(ug,vg)作为标签数据实现神经网络的监督学习。
据再经过BatchNorm归一化和Reshape数据格式转换传入隐藏层。深度神经网络所预测的结
果是个体的在X轴和Y轴的速度(ug,vg),因此神经网络的输出层是包含2个神经元的全连接
层。输入层和输出层之间是隐藏层,隐藏层包括6个二维卷积层、6个LeakyReLU激活层、3个
MaxPooling池化层和一个Flatten层。其网络结构如图10所示。
硬件是Nvidia‑1080Ti,深度学习的训练次数为100epochs,batch‑size设为100,训练数据
集和测试数据集从选取的人群轨迹数据中获取。
络在训练过程中的训练误差(实线)与测试误差(虚线)。采用的误差计算方法是Mean‑
Absolute‑Error。图12中描述的是系统在训练过程中的训练准确率(实线)与测试准确率
(虚线),准确率的计算方法是神经网络预测值的准确率均值。
序。本发明所使用的两个卷积神经网络都是采用MaskRCNN的结构。Mask R‑CNN是一个图像
分割算法,可以完成图像物体分类、图像物体检测、图像物体轮廓识别等多种任务,灵活而
强大。除此之外,一些图像处理的步骤也是不可或缺的重要部分。
图中。
的共同影响下开始向不同方向移动。图15是当进行了t=200轮预测后,邻近的个体开始呈
现出群体行为,整个人群形成两个子群体,并向两个相反方向移动。这一群体行为与真实视
频中人群的移动方式相似。图16是在t=500时,两组人群以相似的速度和相似的轨迹向两
个方向继续移动,人群也达到了一种平衡状态。
和距离等因素的影响。仿真结果表明,神经网络的预测结果符合真实情况下的人群运动行
为,即本发明提出的仿真方法真实有效。
同时扩大感知域,生成高质量的人群分布密度图。
影响,提高了仿真的精准度。
然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术
方案的范围。