一种多类别交通事故起数预测方法转让专利

申请号 : CN201811414154.X

文献号 : CN109598929B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 董春娇马继辉孙绪彬李娟

申请人 : 北京交通大学

摘要 :

本发明涉及一种多类别交通事故起数预测方法,针对交通事故频发且影响因素众多的特点,提出了多重多元对数正态模型,实现多类别交通事故起数同步预测。本发明考虑多类别交通事故数据内在相关性,深度挖掘交通事故影响因素特性,预测精度高、鲁棒性好。本发明针对多类别交通事故起数进行同步预测,具有较高的精度和鲁棒性,尤其在交通安全领域较为关注的重大和特大交通事故起数预测方面具有良好的预测效果。本发明为交通事故分析与评价提供了一套全面、综合、具有层次性的交通事故起数预测方法,可以满足交通安全隐患辨识、事故黑点排查、道路改进设计等领域对交通事故起数预测数据的需求,同时也为改善道路交通安全运行环境提供技术支持。

权利要求 :

1.一种多类别交通事故起数预测方法,其特征在于,包括如下步骤:

S1、从交通管理部门提取交通事故数据,道路属性数据,以及交通流运行状态数据,从相关管理部门获取道路周边环境信息;交通事故数据包括交通事故类别;

S2、通过共用字段,将交通事故数据、道路属性数据、交通流运行状态数据和环境信息进行匹配链接,整合为一个数据库,共用字段包括:路段标识码;

S3、对数据库进行数据预处理;

S4、根据数据库中的交通事故类别变量以及路段标识变量,统计得到各路段各类别交通事故起数;

S5、假设路段i发生第j类交通事故起数为yij,yij服从泊松分布,那么路段i发生第j类交通事故起数的概率表示为:其中,yij为路段i发生第j类交通事故起数,其中i=1,2,…,n,n为样本量,为研究的路段数;j=1,2,…,K,K为交通事故类别数,K的取值范围为3~5;λij为在路段i发生第j类交通事故起数的期望值,λij=exp(βjxi+εij);βj为待估计的回归参数向量,xi为自变量向量,为交通事故影响因素集合,εij为多元正态误差;

S6、定义εi={εi1,εi2,…εij,…,εiK}为路段i的多元正态误差矩阵,β={β1,β2,…,βj,…,βK}为待估计回归参数矩阵,推导出路段i发生第j类交通事故起数的期望值λij服从K元的对数正态分布,其概率密度函数为:其中,X={x1,x2,…,xi,…,xn}为交通事故影响因素矩阵;f(λij|X,β,Ω)为λij的概率密度函数;Ω为εi所服从分布的方差;

所述的多元正态误差矩阵εi可采用吉布斯算法采样获得:

其中, 为威希特分布函数;v0为自由度;R0为威希特分

布参数初始值;

S7、式(1)与式(2)构成多重多元对数正态模型,该模型以多类别交通事故起数作为模型因变量,以交通流运行状态数据、道路属性数据和环境信息作为交通事故影响因素,将交通事故影响因素作为模型自变量;

S8、采用基于贝叶斯框架的马尔可夫链蒙特卡罗算法估计多重多元对数正态模型的参数,通过估计回归参数向量βj,预测各类别交通事故起数,即路段i发生第j类交通事故起数的期望值λij,从而明确交通事故影响因素的显著性和对交通安全性的影响程度。

2.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,所述交通事故数据还包括:交通事故严重程度、事故发生时间、地点、事故原因、事故涉及的车辆和驾驶员信息数据。

3.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,按交通事故造成的后果,将交通事故类别分为:轻微事故、一般事故、重大事故、特大事故;

按照交通事故责任划分,将交通事故类别分为:机动车事故、非机动车事故、行人事故、其他事故;

按交通事故的对象分类,将交通事故类别分为:车辆间的交通事故、车辆与行人的交通事故、机动车对非机动车的交通事故、车辆自身事故、车辆对固定物的事故。

4.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,所述数据预处理包括:异常值清理、错误数据纠正、缺失数据修补。

5.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,所述道路属性数据包括:车道数、路肩类型和宽度、中间隔离带类型和宽度、车道宽度、道路纵坡度、限速标志、交通控制类型;

所述环境信息包括:路段所在的地形地貌、周围用地性质、所处地理区位;

所述交通流运行状态数据包括:交通流量、平均速度、交通流密度、大型车混入率。

6.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,交通事故起数以基本路段为单位,按照一年的时间间隔累加统计。

7.如权利要求1所述的多类别交通事故起数预测方法,其特征在于,步骤S8的具体步骤为:S81、假设回归参数向量βj均服从正态分布,根据贝叶斯理论推导得到后验联合概率密度函数和后验核密度函数分别为:其中, 为有关βj的后验联合概率密度函数;β0为待估计的回归参数初始值;B0为待估计的回归参数所服从分布的方差矩阵初始值;R0和r0均为威希特分布参数初始值;

为有关βj的后验概率密度函数;f(Ω-1|R0,r0)为有关Ω-1的概率密度函数;π(εi|yij,β,Ω)为后验核密度函数;ci为后验概率密度函数系数;φ(εi|0,Ω)为有关εi的后验概率密度函数;f(yij|βj,εij)为有关yij的概率密度函数;

S82、利用后验联合概率密度函数、后验核密度函数和WinBUGS软件估计回归参数向量βj,根据得出的回归参数向量βj,预测各类别交通事故起数,若预测的各类别交通事故起数不满足精度要求,则利用后验联合概率密度函数、后验核密度函数和WinBUGS软件重新估计回归参数向量βj,直到最后预测的各类别交通事故起数满足精度要求。

说明书 :

一种多类别交通事故起数预测方法

技术领域

[0001] 本发明涉及道路交通安全领域,具体涉及一种多类别交通事故起数预测方法。

背景技术

[0002] 道路交通事故根据不同划分标准,有不同分类方法。按交通事故造成的后果可分为:轻微事故、一般事故、重大事故、特大事故;按照交通事故责任划分,可分为:机动车事故、非机动车事故、行人事故、其他事故;按交通事故的对象分类,可分为:车辆间的交通事故、车辆与行人的交通事故、机动车对非机动车的交通事故、车辆自身事故、车辆对固定物的事故。
[0003] 不区分交通事故类别,以发生的交通事故总量为因变量建模,难以明确相同影响因素对不同类别交通事故的影响程度和范围。
[0004] 单以某一类交通事故起数为因变量建模,因为不同交通事故类别之间并不是相互独立的,所得到的估计结果往往包含较大偏差,难以满足交通安全分析评价的精度要求。
[0005] 多类别交通事故起数之间具有相互关联的关系。例如:在分析研究中,假设交通事故已经发生的前提下,特大事故起数的增加,意味着轻微事故、一般事故或者是重大事故起数的减少。因此,考虑多类别交通事故起数内在相关性,构建多类别交通事故起数预测模型,能够弥补我国交通安全研究领域理论与方法的不足。
[0006] 本发明提供一种多类别交通事故起数预测方法,在提高交通事故起数预测精度和可靠性的同时,考虑多类别交通事故起数内在相关性,实现多类别交通事故联合建模。
[0007] 本发明的应用可为甄别我国现有道路交通安全隐患、道路设计缺陷等提供理论支撑,为改善道路交通安全运行环境提供技术支持。

发明内容

[0008] 针对现有技术中存在的缺陷,本发明的目的在于提供一种多类别交通事故起数预测方法,解释多类别交通事故起数内在相关性,实现多类别交通事故联合建模,明确影响因素的显著性,进行多类别交通事故起数预测,定量刻画交通事故发展变化趋势。
[0009] 为达到以上目的,本发明采取的技术方案是:
[0010] 一种多类别交通事故起数预测方法,包括如下步骤:
[0011] S1、从交通管理部门提取交通事故数据,道路属性数据,以及交通流运行状态数据,从相关管理部门获取道路周边环境信息;交通事故数据包括交通事故类别;
[0012] S2、通过共用字段,将交通事故数据、道路属性数据、交通流运行状态数据和环境信息进行匹配链接,整合为一个数据库,共用字段包括:路段标识码;
[0013] S3、对数据库进行数据预处理;
[0014] S4、根据数据库中的交通事故类别变量以及路段标识变量,统计得到各路段各类别交通事故起数;
[0015] S5、假设路段i发生第j类交通事故起数为yij,yij服从泊松分布,那么路段i发生第j类交通事故起数的概率表示为:
[0016]
[0017] 其中,yij为路段i发生第j类交通事故起数,其中i=1,2,…,n,n为样本量,一般为研究的路段数;j=1,2,…,K,K为交通事故类别数,K的取值范围为3~5;λij为在路段i发生第j类交通事故起数的期望值,λij=exp(βjxi+εij);βj为待估计的回归参数向量,xi为自变量向量,一般为交通事故影响因素集合,εij为多元正态误差;
[0018] S6、定义εi={εi1,εi2,…εij,…,εiK}为路段i的多元正态误差矩阵,β={β1,β2,…,βj,…,βK}为待估计回归参数矩阵,推导出路段i发生第j类交通事故起数的期望值λij服从K元的对数正态分布,其概率密度函数为:
[0019]
[0020] 其中,X={x1,x2,…,xi,…,xn}为交通事故影响因素矩阵;f(λij|X,β,Ω)为λij的概率密度函数;Ω为εi所服从分布的方差;
[0021] 所述的多元正态误差矩阵εi可采用吉布斯算法采样获得:
[0022]
[0023] 其中, 为威希特分布函数;v0为自由度;R0为威希特分布参数初始值;
[0024] S7、式(1)与式(2)构成多重多元对数正态模型,该模型以多类别交通事故起数作为模型因变量,以交通流运行状态数据、道路属性数据和环境信息作为交通事故影响因素,将交通事故影响因素作为模型自变量;
[0025] S8、采用基于贝叶斯框架的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)算法估计多重多元对数正态模型的参数,通过估计回归参数向量βj,预测各类别交通事故起数,即路段i发生第j类交通事故起数的期望值λij,从而明确交通事故影响因素的显著性和对交通安全性的影响程度。
[0026] 在上述方案的基础上,所述交通事故数据还包括:交通事故严重程度、事故发生时间、地点、事故原因、事故涉及的车辆和驾驶员信息数据。
[0027] 在上述方案的基础上,所述数据预处理包括:异常值清理、错误数据纠正、缺失数据修补等。
[0028] 在上述方案的基础上,所述道路属性数据包括:车道数、路肩类型和宽度、中间隔离带类型和宽度、车道宽度、道路纵坡度、限速标志、交通控制类型等;
[0029] 所述环境信息包括:路段所在的地形地貌、周围用地性质、所处地理区位等;
[0030] 所述交通流运行状态数据包括:交通流量、平均速度、交通流密度、大型车混入率等。
[0031] 在上述方案的基础上,按交通事故造成的后果,将交通事故类别分为:轻微事故、一般事故、重大事故、特大事故;
[0032] 按照交通事故责任划分,将交通事故类别分为:机动车事故、非机动车事故、行人事故、其他事故;
[0033] 按交通事故的对象分类,将交通事故类别分为:车辆间的交通事故、车辆与行人的交通事故、机动车对非机动车的交通事故、车辆自身事故、车辆对固定物的事故。
[0034] 在上述方案的基础上,交通事故起数以基本路段为单位,按照一年的时间间隔累加统计。
[0035] 在上述方案的基础上,步骤S8的具体步骤为:
[0036] S81、假设回归参数向量βj均服从正态分布,根据贝叶斯理论推导得到后验联合概率密度函数和后验核密度函数分别为:
[0037]
[0038]
[0039] 其中, 为有关βj的后验联合概率密度函数;β0为待估计的回归参数初始值;B0为待估计的回归参数所服从分布的方差矩阵初始值;R0和r0均为威希特分布参数初始-1值; 为有关βj的后验概率密度函数; 为有关Ω 的概率密度函
数;π(εi|yij,β,Ω)为后验核密度函数;ci为后验概率密度函数系数;φ(εi|0,Ω)为有关εi的后验概率密度函数;f(yij|βj,εij)为有关yij的概率密度函数。
[0040] S82、利用后验联合概率密度函数、后验核密度函数和WinBUGS软件估计回归参数向量βj,根据得出的回归参数向量βj,预测各类别交通事故起数,若预测的各类别交通事故起数不满足精度要求,则利用后验联合概率密度函数、后验核密度函数和WinBUGS软件重新估计回归参数向量βj,直到最后预测的各类别交通事故起数满足精度要求。
[0041] 所述多类别交通事故起数预测方法,能够解释多类别交通事故数据内在相关性,判断影响因素的显著性,实现拟合优度更好的多类别交通事故联合建模。
[0042] 技术效果:本发明提供了一种多类别交通事故起数预测方法,针对交通事故频发且影响因素众多的特点,提出了多重多元对数正态模型,实现多类别交通事故起数同步预测。
[0043] 本发明考虑多类别交通事故数据内在相关性,深度挖掘交通事故影响因素特性,预测精度高、鲁棒性好。
[0044] 本发明针对多类别交通事故起数进行同步预测,具有较高的精度和鲁棒性,尤其在交通安全领域较为关注的重大和特大交通事故起数预测方面具有良好的预测效果。
[0045] 本发明为交通事故分析与评价提供了一套全面、综合、具有层次性的交通事故起数预测方法,可以满足交通安全隐患辨识、事故黑点排查、道路改进设计等领域对交通事故起数预测数据的需求,同时也为改善道路交通安全运行环境提供技术支持。

附图说明

[0046] 本发明有如下附图:
[0047] 图1是本发明的流程图;
[0048] 图2是重大交通事故起数预测结果与真实值的拟合效果对比示意图;
[0049] 图3是轻微交通事故起数预测结果与真实值的拟合效果对比示意图;
[0050] 图4是一般交通事故起数预测结果与真实值的拟合效果对比示意图;
[0051] 图5是交通事故起数预测结果与其它模型的拟合效果对比示意图。

具体实施方式

[0052] 以下结合附图1-5对本发明作进一步详细说明。
[0053] 本发明所述的多类别交通事故起数预测方法,主要包括如下步骤:
[0054] S1、针对研究道路所在区域,从交通管理部门获取交通事故数据,道路属性数据,以及交通流运行状态数据,从相关管理部门获取道路周边环境信息;交通事故数据包括交通事故类别;
[0055] S2、结合通用字段,如路段编号等将获取的数据进行匹配链接,整合为一个数据库,
[0056] S3、同时对数据库进行异常值清理、错误数据纠正、缺失数据修复等数据预处理工作;
[0057] S4、根据数据库中的交通事故类别变量以及路段标识变量,统计得到各路段各类别交通事故起数;
[0058] S5、假设路段i发生第j类交通事故起数为yij,yij服从泊松分布,那么路段i发生第j类交通事故起数的概率表示为:
[0059]
[0060] 其中,yij为路段i发生第j类交通事故起数,其中i=1,2,…,n,n为样本量,一般为研究的路段数;j=1,2,…,K,K为交通事故类别数,K的取值范围为3~5;λij为在路段i发生第j类交通事故起数的期望值,λij=exp(βjxi+εij);βj为待估计的回归参数向量,xi为自变量向量,一般为交通事故影响因素集合,εij为多元正态误差;
[0061] S6、定义εi={εi1,εi2,…εij,…,εiK}为路段i的多元正态误差矩阵,β={β1,β2,…,βj,…,βK}为待估计回归参数矩阵,推导出路段i发生第j类交通事故起数的期望值λij服从K元的对数正态分布,其概率密度函数为:
[0062]
[0063] 其中,X={x1,x2,…,xi,…,xn}为交通事故影响因素矩阵;f(λij|X,β,Ω)为λij的概率密度函数;Ω为εi所服从分布的方差;
[0064] 所述的多元正态误差矩阵εi可采用吉布斯算法采样获得:
[0065]
[0066] 其中, 为威希特分布函数;v0为自由度;R0为威希特分布参数初始值;
[0067] S7、式(1)与式(2)构成多重多元对数正态模型,该模型以多类别交通事故起数作为模型因变量,以交通流运行状态数据、道路属性数据和环境信息作为交通事故影响因素,将交通事故影响因素作为模型自变量;
[0068] S8、采用基于贝叶斯框架的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)算法估计多重多元对数正态模型的参数,通过估计回归参数向量βj,预测各类别交通事故起数,即路段i发生第j类交通事故起数的期望值λij,从而明确交通事故影响因素的显著性和对交通安全性的影响程度。
[0069] 在上述方案的基础上,所述交通事故数据还包括:交通事故严重程度、事故发生时间、地点、事故原因、事故涉及的车辆和驾驶员信息数据。
[0070] 在上述方案的基础上,所述道路属性数据包括:车道数、路肩类型和宽度、中间隔离带类型和宽度、车道宽度、道路纵坡度、限速标志、交通控制类型等;
[0071] 所述环境信息包括:路段所在的地形地貌、周围用地性质、所处地理区位等;
[0072] 所述交通流运行状态数据包括:交通流量、平均速度、交通流密度、大型车混入率等。
[0073] 在上述方案的基础上,按交通事故造成的后果,将交通事故类别分为:轻微事故、一般事故、重大事故、特大事故;
[0074] 按照交通事故责任划分,将交通事故类别分为:机动车事故、非机动车事故、行人事故、其他事故;
[0075] 按交通事故的对象分类,将交通事故类别分为:车辆间的交通事故、车辆与行人的交通事故、机动车对非机动车的交通事故、车辆自身事故、车辆对固定物的事故。
[0076] 在上述方案的基础上,步骤S8的具体步骤为:
[0077] S81、假设回归参数向量βj均服从正态分布,根据贝叶斯理论推导得到后验联合概率密度函数和后验核密度函数分别为:
[0078]
[0079]
[0080] 其中, 为有关βj的后验联合概率密度函数;β0为待估计的回归参数初始值;B0为待估计的回归参数所服从分布的方差矩阵初始值;R0和r0均为威希特分布参数初始值; 为有关βj的后验概率密度函数;f(Ω-1|R0,r0)为有关Ω-1的概率密度函数;π(εi|yij,β,Ω)为后验核密度函数;ci为后验概率密度函数系数;φ(εi|0,Ω)为有关εi的后验概率密度函数,f(yij|βj,εij)为有关yij的概率密度函数。
[0081] S82、利用后验联合概率密度函数、后验核密度函数和WinBUGS软件估计回归参数向量βj,根据得出的回归参数向量βj,预测各类别交通事故起数,若预测的各类别交通事故起数不满足精度要求,则利用后验联合概率密度函数、后验核密度函数和WinBUGS软件重新估计回归参数向量βj,直到最后预测的各类别交通事故起数满足精度要求。
[0082] 交通事故起数以基本路段为单位,按照一年的时间间隔累加统计;
[0083] 本发明建立的多重多元对数正态模型通过WinBUGS软件进行回归参数估计。首先利用式(3),(4)和(5)各抽取一组初始值,即一条马尔科夫链,利用WinBUGS软件进行运算,共进行10000次迭代运算,通过观测输出的图形,判断模型是否收敛。在模型收敛的情况下,为了减低误差,舍弃前5000次迭代计算得到的结果,根据后5000次迭代计算的结果估计回归系数。
[0084] 以美国田纳西州四条道路为研究对象,从田纳西州交通厅获取2010年到2014年五年的交通事故数据和影响因素数据。2010年到2013年的数据用于构建模型,2014年的数据用于检验模型的预测效果。
[0085] 交通事故起数按照轻微事故、一般事故、重大事故进行统计,统计时段为一年。
[0086] 交通事故影响因素数据包括:路段长度、年平均日交通量、车道数、路肩类型及宽度、隔离带类型及宽度、交通控制类型、限速标志、有无照明设施、路段所在地势、路段周围用地情况。
[0087] 应用WinBUGS软件,以多类别交通事故起数为因变量,交通事故影响因素为自变量,构建多重多元对数模型。
[0088] 采用基于贝叶斯框架的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)算法估计模型参数。
[0089] 结合模型参数估计结果,同步预测轻微事故、一般事故、和重大事故起数。
[0090] 如图2-4所示,对比结果表明,本发明所述的多类别交通事故起数预测方法,能够考虑多类别交通事故数据内在相关性,深度挖掘交通事故影响因素特性,预测精度高、鲁棒性好。
[0091] 本发明能够实现轻微事故、一般事故和重大事故同步预测,并具有较高的精度和鲁棒性,尤其在交通安全领域较为关注的重大交通事故数据上具有良好的预测效果。
[0092] 如图5所示,将本发明所述方法的预测结果与采用零堆积负二项回归法得到的结果进行了比较,结果显示,本发明所述方法的预测结果优于采用零堆积负二项回归法得到的结果。
[0093] 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0094] 本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。