一种客流分级预警异常告警方法、设备及存储介质转让专利

申请号 : CN202111288369.3

文献号 : CN113723716B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈振武陶勰琨彭逸洲吴宗翔

申请人 : 深圳市城市交通规划设计研究中心股份有限公司深圳市交通科学研究院有限公司

摘要 :

一种客流分级预警异常告警方法、设备及存储介质,属于智能交通控制技术领域,为解决不同场景客流分级预警不精确以及告警不及时的问题,该方法利用概率分布和概率密度函数进行确认概率分布以及计算区域积分,确认置信度和置信区间用于估计误差以及参考范围,利用数据归一化挖掘指标,最终通过客流分级预警和客流实时告警实现基于深度神经网络客流分级预警和异常告警的方法;采用了预测模型与真实观测数据的残差分布进行预警预测,针对不同应用场景进行残差的区间估计、预测客流区间,提升模型的鲁棒性和泛化能力;并且实现分级预警和实时告警,支持使用人员制定对应级别预警预案,灵活应用于各种需监管的场合。

权利要求 :

1.一种客流分级预警异常告警方法,其特征在于:该方法的具体步骤如下:步骤一,残差计算单元,计算客流历史真实数据与历史预测数据的残差,并通过假设检验、区间估计统计学方法,针对残差进行参数估计和假设检验,验证其最优拟合分布,得到残差最优分布;

步骤二,计算不同场景下的预警权重;

在不同场景下分别设定重要系数,代表不同场景的预警权重,重要系数计算公式如下:其中i表示场景类别,β表示该场景的预警权重,μ表示基于人工规则设定的重要系数,2

表示该场景预测模型的R值,λ表示修正因子,用于动态修正预测模型结果和人工规则重要系数权重的占比,Normalization()表示归一化处理;

步骤三,利用步骤二得出的预警权重,并根据残差计算单元处理结果,修正置信区间,具体方法是:

首先计算置信区间数据:通过步骤一残差计算单元所述的方法,计算得到历史客流残差数据flowres统计信息:置信区间上限值resupper、置信区间下限值reslower、置信区间均值resmean、置信区间标准差resstd;

其次通过步骤二预警权重更新单元,计算得到不同场景对应的预警权重β,其中节假日大客流场景权重β节假日=0.3;

最后通过运用置信区间数据、各场景预警权重,结合预警权重设计原则,通过以下公式计算得到节假日大客流场景下的置信区间上下限值:res′upper=resupper+β节假日*(resmean+resstd)res′lower=reslower‑β节假日*(resmean+resstd);

步骤四,利用步骤三中获得的置信区间求解预警阈值;

针对不同区域客流等级以及疏散等级不同,根据历史残差分布数据,初始化4个置信度,取置信度α∈[0.1,0.3,0.6,0.9],通过权重修正输出不同置信度下、不同场景的置信区间上限值和下限值,与客流预测值相加计算得到客流预测值的上下限区间,计算方式如下:flowupper=res′upper+flowpredictflowlower=res′lower+flowpredict;

步骤五,构建基于网格交叉验证的监测预警模型,将初始参数、真实预警数据、客流残差数据输入模型,迭代更新符合最新模型参数;

步骤六,观测客流实时数据和预测区间,按照指定规则进行实时告警和分级预警。

2.根据权利要求1所述的一种客流分级预警异常告警方法,其特征在于:在步骤一中,所述历史预测数据为预测模型实时的客流预测数据,针对残差进行参数估计和假设检验,验证其最优拟合分布;基于所述最优拟合分布设置置信度,通过其概率密度函数,求解得到该分布的置信区间及置信上下限阈值。

3.根据权利要求1所述的一种客流分级预警异常告警方法,其特征在于:所述基于人工2

规则设定的重要系数μ和该场景预测模型的R的值 取值范围均在0‑1之间,越接近1代表权重越大;

对于所述的修正因子λ,若λ>1,代表预测模型的权重越大;λ<1代表人工规则的权重越大。

4.根据权利要求1所述的一种客流分级预警异常告警方法,其特征在于:在步骤五中,建立深度神经网络模型,初始输入参数包括:场景重要系数、基于人工规则设定的重要系数、修正因子和置信度。

5.一种电子设备,其特征在于:包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行权利要求1至4任一项所述一种基于残差分析的客流分级预警异常告警方法的步骤。

6.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至4任一项所述一种基于残差分析的客流分级预警异常告警方法的步骤。

说明书 :

一种客流分级预警异常告警方法、设备及存储介质

技术领域

[0001] 本发明是一种分级预警和异常告警的方法,尤其涉及基于残差分析的分级预警与异常告警算法,属于智能交通控制技术领域。

背景技术

[0002] 近年来,随着我国城市化进程的逐步加快和发展,城市人口的急剧增加,随着城市人口的不断增加,在一些大型的公共场合,例如公交站、地铁站、商场、节日庆贺活动场所、
体育赛事场地等人流量较大的地方,需要对客流量进行监管,实现客流量的监测、管理、分
级预警和实时告警,及时分析重大的客流安全隐患,进而帮助管理部门在第一之间作出判
断,当客流高峰时期采取适当的措施,正确引流,防患于未然,避免事故的发生。
[0003] 现有的客流分级预警方案中没有针对残差进行分布检验,仅设定残差的最大值作为异常判定阈值,若存在异常样本,将影响预测模型结果,会导致某一时刻残差值很大,但
发生的概率很小,无法用于进行阈值判定。
[0004] 另外现有技术没有分场景进行残差检验,而不同场景的预测模型精度可能有所不同,可能不同场景的预警精度差异较大,模型泛化能力较差。

发明内容

[0005] 为解决现有技术中现有不同场景客流分级预警的不够精确以及告警不及时的问题,本发明提出一种基于残差分析的客流分级预警异常告警方法、设备及存储介质,具体方
案如下:
[0006] 方案一:该方法利用概率分布和概率密度函数进行确认概率分布以及计算区域积分,确认置信度和置信区间用于估计误差以及参考范围,利用数据归一化挖掘指标,最终通
过客流分级预警和客流实时告警实现基于深度神经网络客流分级预警和异常告警的方法。
[0007] 进一步地,所述的数据标归一化,指对原始数据的线性变换,使结果值映射到[0‑1]之间;所述原始数据经过数据归一化处理后,各指标处于同一数量级,用于对比评价。
[0008] 进一步地,该方法的具体步骤如下:
[0009] 步骤一,利用残差计算单元,计算客流历史真实数据与历史预测数据的残差,并通过架设校验、区间估计统计学方法,得到残差最优分布;
[0010] 步骤二,对预警权重进行计算,即计算不同场景下的预警警权重;
[0011] 步骤三,利用步骤二得出的预警权重,根据所述残差计算单元处理结果,修正置信区间;
[0012] 步骤四,利用步骤三中获得的置信区间求解预警阈值;
[0013] 步骤五,构建基于网格交叉验证的监测预警模型,将初始参数、真实预警数据、客流残差数据输入模型,迭代更新符合最新模型参数;
[0014] 步骤六,观测客流实时数据和预测区区间,按照指定规则进行实时告警和分级预警。
[0015] 进一步地,在步骤一中,所述历史预测数据为预测模型实时的客流预测数据,针对残差进行参数估计和假设检验,验证其最优拟合分布;基于所述最优拟合分布设置置信度,
通过其概率密度函数,求解得到该分布的置信区间及置信上下限阈值。
[0016] 进一步地,所述步骤二中,在不同场景下分别设定重要系数,代表不同场景的预警权重,重要系数计算公式如下:
[0017]
[0018] 其中i表示场景类别,β表示该场景的预警权重,μ表示基于人工规则设定的重要系2
数, 表示该场景预测模型的R 值,λ表示修正因子,用于动态修正预测模型结果和人工规
则重要系数权重的占比。
2
[0019] 进一步地,所述基于人工规则设定的重要系数μ和该场景预测模型的R的值 取值范围均在0‑1之间,越接近1代表权重越大;
[0020] 对于所述的修正因子λ,若λ>1,代表预测模型的权重越大;λ<1代表人工规则的权重越大。
[0021] 进一步地,所述步骤四,针对不同区域客流等级以及疏散等级不同,根据历史残差分布数据,初始化4个置信度,所述取置信度α∈[0.1,0.3,0.6,0.9],通过权重修正输出不
同置信度下、不同场景的修正区间的置信区间上限值和下限值,与客流预测值相加计算得
到客流预测值的上下限区间。
[0022] 进一步地,在步骤五中,建立深度神经网络模型,所述初始输入参数包括:场景重要系数、基于人工规则设定的重要系数、修正因子和置信度。
[0023] 方案二:一种电子设备,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述方案中方法的步骤。
[0024] 方案三:一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方案的方法的步骤。
[0025] 本发明有益效果体现在:
[0026] 由于采用了预测模型与真实观测数据的残差分布进行预警预测,由于计算程序的时效性和准确性,绝大程度上解决了预警预测模型精度对预测结果的影响,同时针对不同
应用场景进行残差的区间估计、预测客流区间,提升模型的鲁棒性和泛化能力;并且实现分
级预警和实时告警,支持使用人员制定对应级别预警预案,灵活应用于各种需监管的场合。

附图说明

[0027] 图1为本发明的一种基于残差分析的客流分级预警异常告警方法流程图;
[0028] 图2为某地铁站18:30‑19:00客流残差分布图;
[0029] 图3为地铁站18:30‑19:00上下限阈值分布图;
[0030] 图4为地铁站晚高峰客流残差上下限阈值分布图;
[0031] 图5为地铁站18:30‑19:00修正上下限(阴影部分)分布图;
[0032] 图6为一种基于残差分析的客流分级预警异常告警方法的方案框架图;
[0033] 为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中
记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。

具体实施方式

[0034] 具体实施方式一:首先描述本实施例所用到的相关定义,利用概率分布和概率密度函数进行确认概率分布以及计算区域积分,确认置信度和置信区间用于估计误差以及参
考范围,利用数据归一化挖掘指标,最终通过客流分级预警和客流实时告警实现一种基于
深度神经网络客流分级预警和异常告警的方法,具体过程如下:
[0035] A.概率分布:用于表述随机变量取值的概率规律,根据随机变量所属类型的不同,概率分布取不同的表现形式,常见的概率分布有正态分布,泊松分布、均匀分布等;
[0036] B.概率密度函数:一种描述随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的
积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。
[0037] C.置信度:置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就
是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的
概率有多大,这个相应的概率称作置信度。
[0038] D.置信区间:置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现
的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的
测量值的可信程度,即前面所要求的“一个概率”。
[0039] E.数据归一化:数据标准化(归一化)处理是数据挖掘的一项基础工作,也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0‑1]之间。原始数据经过数据标准
化处理后,各指标处于同一数量级,适合进行综合对比评价。
[0040] F.客流分级预警:通过模型预测未来一段时间内(根据时间切片确认)可能出现异常的客流,并确认其异常等级,此异常表示与常态客流的差异程度,异常大客流、异常小少
客流等均为异常。
[0041] G.客流实时告警:通过模型得出的告警区间,实时监测不在区间内的异常客流,此异常表示与常态客流的差异程度,异常大客流、异常小少客流等均为异常。
[0042] H.K折交叉验证:交叉验证算法是将训练集的所有数据平均划分成K份(通常选择K=10),取第K份作为验证集,余下的K‑1份作为交叉验证的训练集。
[0043] I.网格搜索算法:网格搜索算法是一种调参手段,通过遍历给定参数组合来优化模型表现的方法。其原理就像是在数组里找最大值。以决策树为例,当确定了要使用决策树
算法的时候,为了能够更好地拟合和预测,需要调整它的参数。在决策树算法中,我们通常
选择的参数是决策树的最大深度。
[0044] J.网格交叉验证算法(GridSearchCV):交叉验证与网格搜索进行结合,作为参数评价的一种方法.网格搜索,搜索的是参数,即在指定的参数范围内,按步长依次调整参数,
利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高的参数,这其实是
一个训练和比较的过程,GridSearchCV可以保证在指定的参数范围内找到精度最高的参
数,但是这也是网格搜索的缺陷所在,他要求遍历所有可能参数的组合,在面对大数据集和
多参数的情况下,非常耗时。
[0045] 具体实施方式二:除上述标准化过程完成该方法,本实施例提供一种基于残差分析的客流分级预警和异常告警方法的具体分步流程:
[0046] 步骤一,残差计算单元:
[0047] 计算客流历史真实数据flowtrue与历史预测数据flowpredict的残差:
[0048] flowres=flowtrue‑flowpredict
[0049] 其中预测数据flowpredict为预测模型实时的客流预测(预测模型可选用常规短时预测模型,保证一定精度即可,本实施例不做重点阐述),针对客流残差,通过参数估计、假
设检验等方法,验证其最优拟合分布,基于最优分布,给定置信度α=0.95(可根据实际情况
进行调整),通过其概率密度函数,求解得到该分布的置信区间及置信上下限阈值。假设残
2
差满足正态分布X~N(μ,σ),设定置信度α=0.95,可以得出其置信区间为[μ‑1.96*σ,μ+
1.96*σ],同时记区间上限值为resupper=μ+1.96*σ,下限值为reslower=μ‑1.96*σ,均值为
resmean=μ,标准差为resstd=σ。
[0050] 步骤二,预警权重更新单元:
[0051] 考虑在常态、节假日、恶劣天气等不同场景下,资源调配难度、客流疏解能力、预测模型精度均有所差异,针对此问题需在不同场景下分别设定重要系数,代表不同场景的预
警权重,重要系数计算公式如下:
[0052]
[0053] 其中i表示场景类别,β表示该场景的预警权重,μ表示基于人工规则设定的重要系2
数(取值范围在0‑1之间,越接近1,代表越重要), 表示该场景预测模型的R 值(取值范围
在0‑1之间,越接近1,代表模型的预测效果越好),λ表示修正因子,可动态修正预测模型结
果和人工规则重要系数权重占比(λ>1,代表预测模型的权重越大,λ<1,代表人工规则的权
重越大),Normalization表示归一化,将权重映射到[0‑1]中。通过以上方法,结合客流预测
模型,设定修正因子λ=1,得出各场景权重系数,详见下表1:
[0054] 表1各场景权重系数表
[0055] 序号 场景类别 权重系数1 常态 0.1
2 节假日大客流 0.3
3 恶劣天气 0.3
4 重要事件 0.25
5 其它 0.05
[0056] 步骤三,置信区间修正单元:
[0057] 根据残差计算单元处理结果,给定不同置信度,分别计算残差数据对应的置信区间,并得到置信区间上限值resupper、下限值reslower、均值resmean,标准差resstd。考虑在不同
应用场景下,置信区间如仅使用同一套数据,将导致最终模型预警结果缺少鲁棒性和针对
性,针对此问题,本实施例应用场景权重系数模块结果,根据应用场景特点,动态调整置信
区间,场景重要系数越大,区间微调幅度越大。以节假日大客流场景权重β节假日=0.3为例,修
正步骤如下:
[0058] 1、计算置信区间数据:
[0059] 通过步骤一残差计算单位所述的方法,计算得到历史客流残差数据flowres统计信息:resupper、reslower、resmean、resstd。
[0060] 2、初始化预警权重:
[0061] 通过步骤二预警权重更新单元,计算得到不同场景对应的预警权重β,其中节假日大客流场景权重β节假日=0.3。
[0062] 3、修正置信区间
[0063] 通过运用置信区间数据、各场景预警权重,结合预警权重设计原则,通过以下公式计算得到节假日大客流场景下的置信区间上下限值。
[0064] res′upper=resupper+β节假日*(resmean+resstd)
[0065] res′lower=reslower‑β节假日*(resmean+resstd)
[0066] 步骤四,置信区间求解单元:
[0067] 针对不同区域客流等级以及疏散等级不同,本实施方式基于历史客流残差分布数据flowres,初始化4个置信度,α∈[0.1,0.3,0.6,0.9],运用权重修正模块输出不同置信度
下不同场景的修正区间res′upper、res′lower,通过与客流预测值相加,计算得到客流预测值
的上下限区间;计算方式如下:
[0068] flowupper=res′upper+flowpredict
[0069] flowlower==res′lower+flowpredict
[0070] 综上所述,可以计算的得出4个置信度依次对应的客流预测区间,记为[flow1lower,flow1upper]、[flow2lower,flow2upper]、[flow3lower,flow3upper]、[flow4lower,flow4upper],通过
区间估计,进一步得出真实客流值大于flow1upper、flow2upper、flow3upper、flow4upper的概率分
别为0.45、0.65、0.80、0.95。考虑本实施方式主要解决客流预警任务,因此主要针对预测客
流上限值进行监测。
[0071] 基于公交运营相关单位实时运力监测数据,结合行业规则,设定预警阈值,若当前时刻运力t‑客流flow>阈值V,则进行预警,通过初始化4个置信度,求解4个置信区间,按照
置信度大小进行分级预警,依次针对t‑flow1upper,t‑flow2upper,t‑flow3upper,t‑flow4upper与
阈值V进行大小判断,只要发现超过阈值,执行预警,并且预警级别越高,表示发生需要预警
情况的概率越大,具体方案详见下表2:
[0072] 表2预警级别框架表
[0073]
[0074]
[0075] 步骤五,参数更新单元:
[0076] 通过观测各级预警响应准确率,根据响应效果,积累历史观测的客流数据和预警级别数据(预警级别根据不同使用人的主观评定)基于5折网格交叉验证算法
(GridSearchCV)算法,输入历史客流残差数据、模型超参、真实预警数据,建立监测模型,定
期动态修正模型最优超参数,具体实现步骤如下:
[0077] 1、确定交叉验证超参数列表,列表总结如下:
[0078]
[0079] 2、将积累的历史数据(包括历史客流残差数据、真实预警数据)按7:3比例划分训练集、测试集;其中训练集用来模型训练,测试集用来衡量模型表现好坏。
[0080] 3、将训练集平均划分5份(对应参数K),依次将其中一份设为测试集,其它设为训练集。
[0081] 4、将模型参数依次循环迭代,确保参数间任意排列组合不会缺失,将每组参数组合代入模型,按照步骤一至步骤四执行,计算客流修正区间并判断是否需要预警,最后通过
与真实预警情况进行对比,选取准确率最高的一组参数为最优参数。
[0082] 步骤六,预警和告警单元:
[0083] 通过结合以上5个步骤设定预警和告警规则如下:
[0084] 客流实时告警:根据步骤一残差计算单元,给定置信度α=0.95(建议设定的置信度不小于0.90),计算得到置信区间上下限[reslower,resupper]。同时通过实时观测客流flow
变化情况,,若出现flow>resupper,表示此时的客流数有95%的概率超出了历史的最大值,
故默认进行告警。
[0085] 客流分级预警:将本方案按照步骤一至步骤四依次执行,计算得到4种级别客流预警区间,通过的步骤四的预警规则,判定预警级别。同时通过步骤五,监测预警效果,实时更
新模型参数。
[0086] 具体实施方式三:实施例可以根据上述方法示例可根据说明书附图6所示框图进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上
的功能集成在一个处理模块中;上述集成的模块既可以采用硬件的形式实现,也可以采用
软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅
为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0087] 具体地,基于深度神经网络客流分级预警和异常告警设备包括处理器、存储器、总线和通信设备;
[0088] 所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,所述处理器执行所述存储器存储的所述计算机执行指令,所述的通信设备负责与外界
网络连接,进行数据的收发过程;所述处理器与存储器相连,所述的存储器包括数据库软
件;
[0089] 所述数据库软件为SQL Server2005以上版本的数据库,并存储在计算机可读存储介质中;所述处理器与存储器包含的若干指令用以使得个人计算机或服务器或网络设备执
行本方法全部或部分步骤;所述处理器所用类型包括中央处理器、通用处理器、数字信号处
理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件
部件或者其任意组合;所述存储介质包括U盘、移动硬盘、只读存储器、随机存取存储器、磁
碟或者光盘。
[0090] 具体地,上述软件系统部分承载于中央处理器(Central Processing Unit,CPU),通用处理器,数字信号处理器(Digital Signal Processor,DSP),专用集成电路
(Application‑Specific Integrated Circuit,ASIC),现场可编程门阵列(Field 
Programmable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或
者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,
模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组
合,DSP和微处理器的组合等等。相关人员及用户通信的通信设备则可以利用收发器、收发
电路或通信接口等。
[0091] 本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能
存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另
一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何
可用介质。
[0092] 由此可见,本发明只是对方法及系统的示例性说明,并不限定它的保护范围,本发明有许多变形和变化而不脱离本发明的精神本领域技术人员还可以对其局部进行改变,只
要没有超出本专利的精神实质,都在本发明的保护范围内。