智慧交通信号灯组网协同优化控制系统及控制方法转让专利
申请号 : CN202010392103.2
文献号 : CN111710177B
文献日 : 2021-07-27
发明人 : 章玥 , 韩园峰 , 蒲戈光
申请人 : 华东师范大学 , 上海工业控制安全创新科技有限公司
摘要 :
权利要求 :
1.一种智慧交通信号灯组网协同优化控制系统,其特征在于,包括:数据采集与设备控制模块,用于控制监控摄像机采集车流信息,对采集的信息进行包装,明确信息的来源摄像机,摄像机的位置、采集时间信息,并上传到指挥中心模块与信息提取模块;
所述数据采集与设备控制模块还负责接收其他模块传输的交通信号灯控制信号,控制交通信号灯的切换;
信息提取模块,包含多个局部信息提取模块,每个局部信息提取模块部署在一个边缘服务器上,负责从所述数据采集与设备控制模块接收监控摄像机的视频流信息,利用训练完成的深度卷积神经网络提取视频流中每个交通路口的等待红灯的车辆数量、车辆的等待时间信息;整合多个路口的车辆信息,计算车辆从等待到穿过路口所需的平均时间,将所有的计算结果整合设备信息传输到决策模块;
决策模块,负责交通信号灯控制的决策;所述决策模块划分为多个局部决策模块,每个局部决策模块部署在一个边缘服务器中;局部决策模块包含多个边缘决策模块,每个边缘决策模块控制一个交通信号灯;边缘决策模块接收并向相邻路口对应的边缘决策模块、局部决策模块共享信息提取模块的信息,使用强化学习技术,根据所述信息提取模块提取的信息和从相邻路口对应的边缘决策模块接收的信息,做出交通信号灯信号变化与否的决策,并将决策信息上传到指挥中心模块,与此同时将决策指令下发到所述数据采集与设备控制模块;
所述决策模块还接收指挥中心下发的干预指令,调整决策,再下发指令到数据采集与设备控制模块;
所述决策模块对交通信号灯控制进行了组网设计,即当前交通路口的决策受到下一个交通路口观测信息的影响,若下一个交通路口交通状况较差,本交通路口将减少放行车辆;
所述决策模块将观测信息和激励函数中本路口的排队车辆的数量减去了同向相邻路口排队车辆数量与权重因子ρ的乘积,ρ可以设置为0‑1之间的浮点数;若差为负数,设置该值为
0;观测值state设置如下:State=[[排队的车辆数量‑同向相邻路口排队车辆数量×ρ],平均等待时长],[平均通行时间],[特种车辆数量]]激励函数设置如下:
R=‑(排队的车辆数量‑同向相邻路口排队车辆数量×ρ+平均等待时长)‑平均通行时
2 2
间‑特种车辆的数量×平均通行时间指挥中心模块,用于整合信息,数据可视化,提供高层决策接口,干预所述决策模块的决策。
2.根据权利要求1所述的智慧交通信号灯组网协同优化控制系统,其特征在于,每个智能体控制一个交通信号灯,在强化学习过程中,将多个相邻交通路口的观测信息整合在一起,激励值整合在一起,即负责一个区域的n个相邻的路口交通信号灯的n个智能体,共享区域的观测信息与激励值信息,实现多个智能体之间协同优化。
3.一种智慧交通信号灯组网协同优化控制方法,其特征在于,采用如权利要求1或2所述的智慧交通信号灯组网协同优化控制系统,所述方法包括以下步骤:S1.数据采集与设备控制模块执行步骤如下:步骤S101.对每一个路口设备集合,建立设备信息表;
步骤S102.建立数据采集与设备控制模块建立和信息提取模块的连接,并且传输邻接信息表;
步骤S103.局部区域的多个路口监控摄像机实时采集路口的交通流信息,传输到边缘服务器,边缘服务器将邻接信息表和视频流动态打包,上传到指挥中心服务器;
步骤S104.局部区域的多个路口的交通信号灯每间隔1s采集当前的周期信息一次,传输到边缘服务器;
步骤S105.接收指挥中心模块和决策模块的指令,控制交通信号灯;
S2.信息提取模块的执行步骤如下:步骤S201.轮流获取每个交通路口的每个方向的视频流,每一秒分别从每个视频流中截取1帧图像;
步骤S202.利用深度卷积神经网络提取图片中的车辆的类别信息、车辆唯一标识信息、排队数量信息以及特种车辆的数量并以队列形式保存;
步骤S203.从信息队列中根据多次保存的信息获取排队的前5‑10个车辆的计算车辆的平均等待时长;
步骤S204.利用从不同监控摄像机提取的信息,计算同一车辆从第一次识别到再次识别的时间,即从等待到穿过交通路口的时间;
步骤S205.每间隔2‑5s整合计算信息,得到信息表并传输到局部决策模块;
S3.决策模块的执行步骤如下:步骤S301.接收从信息提取模块传输的信息表,接收从指挥中心模块下发的指令,并进行相关处理;
步骤S302.根据信息表中的相邻路口的信息,将该表格传输给相邻的边缘决策模块,同时将信息表上传到指挥中心服务器;
步骤S303.整合每个边缘决策模块管辖的信息提取模块的信息和相邻路口对应的边缘决策模块发送的信息;
步骤S304.将上述信息,即排队的车辆数量、等待的时长和平均通行时间和特种车辆数量作为观测信息;训练完成的强化学习的智能体根据观测信息做出决策;
步骤S305.根据决策信息生成决策指令,将决策信息上传到指挥中心,并且下发指令控制交通信号灯;
S4.指挥中心模块的执行步骤如下:步骤S401.接收边缘服务器上传的信息,可视化展示。
4.根据权利要求3所述的智慧交通信号灯组网协同优化控制方法,其特征在于,所述指挥中心模块的执行步骤进一步包括:步骤S402.对决策干预决策模块的决策。
5.根据权利要求3所述的智慧交通信号灯组网协同优化控制方法,其特征在于,所述指挥中心模块的执行步骤进一步包括:步骤S403.特殊情况时直接由指挥中心指挥所有交通信号灯。
6.根据权利要求3所述的智慧交通信号灯组网协同优化控制方法,其特征在于,所述指挥中心模块的执行步骤进一步包括:步骤S404.管理升级所述智慧交通信号灯组网协同优化控制系统的软件。
说明书 :
智慧交通信号灯组网协同优化控制系统及控制方法
技术领域
背景技术
轻城市交通压力,人们将目光投向大数据技术与人工智能领域,希望借助大数据分析与智
能计算技术优化城市交通问题,减轻交通负担。
识别、车辆跟踪等技术是本系统的必要技术。智慧城市建设过程中将会为智慧交通系统提
供更多的硬件支持如监控摄像机、传感器等。
R‑CNN方法、YOLO算法、SSD(Single Shot MultiBox Detector)算法。
监控摄像机之间路程的通行时间,评价路段的通行能力。
(Sydney Coordinated Adaptive Traffic System)方法。这些方法一般通过简单的规则优
化交通信号灯每个周期的时间。交通流量在时间跨度上有较大变化,并且存在着特殊情景,
简单的规则设计无法起到良好的优化效果。目前人工智能方法在交通信号灯控制领域受到
越来越多的关注,尤其是强化学习技术。
录。通过概率状态转换函数,可以根据当前状态和智能体的动作得到下一状态。激励函数根
据环境和智能体的动作计算激励值。学习率决定当前的动作与激励值对将来动作的影响能
力。强化学习过程是智能体在当前状态与环境交互,从环境中得到下一状态和激励值,优化
策略根据激励值对该动作进行评估,影响下一步动作的选择。通过重复上述过程提升智能
体与环境的交互能力。
发明内容
缘服务器,每个边缘服务器接收多个相邻的交通路口车流信息。边缘服务器接收数据后一
方面将该数据上传到交通指挥中心,另一方面使用深度卷积神经网络提取交通路口中每个
车道上等待红灯的车辆的信息。整合多个相邻监控摄像头中提取的车流信息,计算出每个
交通路口等待红灯的车辆的数量、红灯的等待时间,等待到穿过路口的平均通行时间以及
特种车辆的数量。边缘服务器观测信息上传到交通指挥中心和相邻的边缘服务器,并将上
述信息的计算结果和相邻边缘服务器发送的计算结果作为观测信息,输入到已经训练完成
的强化学习智能体,智能体根据当前的观测信息决策,并且将交通信号灯控制信号传输到
指挥中心和路口的交通信号控制灯,交通信号灯根据信号控制车辆通行与否。为了提升系
统的安全性与鲁棒性,本系统接入交通指挥中心,对接收到的所有信息进行可视化展示,提
供控制接口,可以实现对决策模块的决策进行干预,或直接接管决策模块的决策。
与信息提取模块。此模块还负责接收其他模块传输的交通信号灯控制信号,控制交通信号
灯的切换。每个数据采集与设备控制模块包含多个局部设备模块,每个局部设备模块包含
多个路口的监控摄像机与交通信号灯及其相关控制软件。
练完成的深度卷积神经网络提取视频流中每个交通路口的等待红灯的车辆数量、前5‑10个
车辆的等待时间信息、特种车辆的数量。整合多个路口的车辆信息,计算车辆从等待到穿过
路口所需的平均时间。将所有的计算结果整合设备信息传输到决策模块。
边缘决策模块控制一个交通信号灯。用于接收并向相邻路口对应的边缘决策模块、局部决
策模块共享信息提取模块的信息,并且使用强化学习技术,根据信息提取模块提取的信息
和从相邻路口对应的边缘决策模块接收的信息,做出交通信号灯信号变化与否的决策,并
将决策信息上传到指挥中心模块,与此同时将决策指令下发到数据采集与设备控制模块。
该模块还可以接收指挥中心下发的干预指令,调整决策,再下发指令到数据采集与设备控
制模块。
过程如图6自动机所示。
传感器,目前交通路口普遍安置多个监控摄像机,用以监控是否出现交通违章现象。这些摄
像机采集的数据可以用于本系统,大大节省本系统的部署成本。本系统采用了自底向上的
设计,兼顾了数据采集、数据处理、智能决策与指挥中心干预,这些涵盖了交通信号灯控制
的完整流程。本系统对除指挥中心之外的每一个模块都划分了子模块,每一个子模块负责
一个区域的设备管理、信息提取与决策的工作。模块之间可以通过叠加提升系统的规模,所
以本系统可以适应不同规模的城市与区域,可移植性较好。
况较好时,本路口的可以放行更多车辆,反之减少车辆放行,减轻下一路口的拥堵状况。
传统的基于排队长度和平均速度的观测信息和激励函数相比,本系统的观测信息和激励函
数提升了路口上不同方向上的公平性,即不会因为等待的车辆的数量少就使该方向上的车
辆等待的时间远远多于另一个方向上的车辆。同时,本系统能够使特种车辆优先通过。
附图说明
具体实施方式
没有特别限制内容。
灯的组网控制。该系统使用部署在交通路口的监控摄像机采集路口的车流信息上传到边缘
服务器,边缘服务器将信息传输到指挥中心服务器,同时每秒钟截取视频流中的一帧图像,
使用数据提取模块中的深度卷积神经网络提取图像中的信息,这些信息包括车辆的种类、
数量、唯一标识等。利用相邻时间、相邻交通路口采集的信息,计算每个交通路口等待红灯
的车辆的数量、排队的前5‑10辆车的平均等待时间、从等待到通过交通路口的平均时间、特
种车辆的数量信息。边缘服务器与控制相邻路口的边缘服务器共享上述信息,将上述信息
的计算结果和相邻边缘服务器发送的信息整合,作为观测信息输入到已经训练完成的强化
学习智能体,智能体根据当前的观测信息决策,得到交通信号灯的控制信号。边缘服务器将
控制信号和观测信息上传到交通指挥中心,并且将交通信号灯控制信号下发到路口的交通
信号控制灯,交通信号灯根据信号控制车辆通行与否。交通指挥中心模块对接收到的所有
信息进行可视化展示,提供控制接口,可以实现对决策模块的决策进行干预,或直接接管决
策模块的决策。此外交通指挥中心模块还负责系统的升级与管理,保证系统的安全性、稳定
性。
为了清晰的表达系统的细节、执行过程和部署方法,以下内容将结合模块结构、部署细节与
系统执行流程顺序进行详细的阐述。除以下专门提及与强调的公共的知识如深度卷积神经
网络和强化学习技术之外,均为本系统特有的成果,属于本发明保护的范围。
部署过程中,软硬件整合,硬件主要包括部署在交通路口的监控摄像机、交通信号灯,分区
域部署的边缘服务器,服务器之间通信用到的交换机或路由器等设备以及部署在交通指挥
中心的服务器。负责硬件管理,信息提取,决策的软件系统部署在边缘服务器,负责决策干
预,软件系统升级与管理的软件部署在交通指挥中心的服务器。
服务器中保存如图4所示的设备信息表。该信息表包含组编号、设备组的安装位置、相邻的
组编号、设备类型、设备组内编号,设备信息。组编号是对每个路口的所有监控摄像机与交
通信号灯分配的编号。设备位置是该组设备的安装位置。相邻的组编号是与该路口相邻的
路口的组的编号,以“/”分隔。设备类型是用于区分交通信号灯和监控摄像机的字段。设备
编号是设备在组内的编号。组号和设备编号组合形成设备的唯一编号。设备信息保存监控
摄像机和交通信号灯的信息。监控摄像机的设备信息是监控摄像机所拍摄的路段,交通信
号灯的设备信息是交通信号灯每1s显示的信号。
提取模块主要由深度卷积神经网络组成,首先使用公共数据集训练深度卷积神经网络,训
练完成后复制部署到边缘服务器,使用数据采集与设备控制模块的视频数据流测试,若测
试精度较低,系统在边缘服务器继续训练,达到较高精度时系统可以正式投入使用。深度卷
积神经网络是公共知识,不包括在本发明之内,而部署方案与方法设计属于本发明成果。
化方法和特种车辆优先通过方法具体表现在:
止道路拥堵恶化导致车辆长时间无法通行。为了达成这一目的,本发明中将观测信息和激
励函数中本路口的排队车辆的数量减去了同向相邻路口排队车辆数量与权重因子ρ的乘
积,ρ可以设置为0‑1之间的浮点数。若差为负数,设置该值为0.此外本发明还相邻的几个交
通路口的观测值state整合到一起,奖励值整合到一起,在运行时每个智能体控制一个交通
信号灯,多个智能体协同优化。
行时间‑特种车辆的数量×平均通行时间
护范围。