一种基于智能网关的智慧电梯管理系统及方法转让专利

申请号 : CN202110242545.3

文献号 : CN112960496B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐胜刘友华戈云娇陆勤灵李舒帆李红雨李九生刘丽敏

申请人 : 佛山市三水区理工学校(佛山市三水区技工学校)

摘要 :

本发明涉及一种基于智能网关的智慧电梯管理系统及方法,所述系统包括物联网设备、服务器和智能网关,所述服务器配置为:将基于预约信息获取的第一信息通过所述智能网关传输至所述物联网设备;至少基于所述物联网设备因所述第一信息的触发而上传的关于行动路径的第二信息和第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或基于预约人员上传的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略。通过该设置方式,本发明能够融合非实时的离线位置信息和在线的定位信息,在预期预约人员达到时间和减少电梯选择的随机性两个角度制定调度/控制策略,从而减少电梯的非预期运行。

权利要求 :

1.一种基于智能网关的智慧电梯管理系统,其特征在于,包括物联网设备(100)、服务器(200)和智能网关(300),其中,所述服务器(200)配置为:

将基于预约信息获取的与预约人员相关的第一信息通过所述智能网关(300)传输至所述物联网设备(100);

至少基于所述物联网设备(100)因所述第一信息的触发而上传的关于行动路径的记载了所述物联网设备(100)的ID信息和时间信息的第二信息和记载了预约人员的位置信息和信号强度信息的第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或基于预约人员上传的记载了其位置信息的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略;

所述智能网关(300)配置为:

在所述服务器(200)和/或物联网设备(100)的远程配置下以周期性访问多个所述物联网设备(100)的方式请求所述物联网设备(100)反馈基于预约的与预约人员相关的第一信息产生的关于行动路径的记载了所述物联网设备(100)的ID信息和时间信息的第二信息和记载了预约人员的位置信息和信号强度信息的第一定位消息,并将第二信息和第一定位消息传输至服务器(200);

在周期性访问的过程中,基于发出所述第二信息的物联网设备(100)以逐个对比的方式搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备(100);

所述物联网设备(100)配置为:

基于所述智能网关(300)传输的关于预约的第一信息向所述智能网关(300)反馈关于预约人员离线路径的第二信息,其中,在所述智能网关(300)的指示下和/或第二信息的触发下发出射频信号和/光信号从而获取预约人员的电子设备反馈的关于在线位置的射频信号和/光信号,并将反馈的射频信号和/光信号传输至所述智能网关(300)。

2.根据权利要求1所述的智慧电梯管理系统,其特征在于,所述服务器(200)配置为按照如下方式预期电梯的调度/控制策略:获取关于预约的第一信息;

基于所述物联网设备(100)反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;

基于第一信息和电梯交通需求预期电梯的调度/控制策略。

3.根据权利要求1所述的智慧电梯管理系统,其特征在于,所述服务器(200)配置为基于深度强化学习/强化学习的算法获取电梯的调度/控制策略,其中,优化目标为:等待时间最短且能源消耗最低;

约束条件为:电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值;

策略变量为:电梯停靠次数和走行距离;

其中,在所述深度强化学习/强化学习的更新函数中,添加以第一定位消息/第二定位消息表征的关于等待时间的损失函数。

4.根据权利要求1所述的智慧电梯管理系统,其特征在于,所述智能网关(300)配置为按照如下步骤融合第二信息和第一定位消息:基于发出所述第二信息的物联网设备(100)以逐个对比的方式搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号去强度差异超过第一阈值的物联网设备(100),其中,以首先发出第二信息的物联网设备(100)的物理位置为起始,按照预先存储的以实际物理位置排序的物联网设备(100)的ID逐个请求物联网设备(100)反馈第一定位消息;

在搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号差异超过第一阈值的物联网设备(100)的过程中,周期性地请求物联网设备(100)反馈第二信息,其中,若获取第二信息,则基于第二信息调整当前获取的第一定位消息以避免第一定位消息传输的位置信息偏离实际。

5.根据权利要求1所述的智慧电梯管理系统,其特征在于,在多个传输第一定位消息的物联网设备(100)中出现至少两个第一定位消息的信号强度差异超过第二阈值的情况下,所述智能网关(300)配置为:屏蔽传输第一定位消息的信号强度小于第四阈值的物联网设备(100),并请求关闭该物联网设备(100);

以该物联网设备(100)的ID为起始搜索未传输第一定位消息的物联网设备(100)从而使得所述智能网关(300)与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备(100)保持通信。

6.根据权利要求1所述的智慧电梯管理系统,其特征在于,在多个传输第一定位消息的物联网设备(100)中出现至少两个第一定位消息的信号强度差异超过第二阈值且不存在传输第一定位消息的信号强度小于第四阈值的物联网设备(100)的情况下,所述智能网关(300)配置为:屏蔽传输第一定位消息的信号强度大于第五阈值的物联网设备(100),并请求关闭该物联网设备(100);

以该物联网设备(100)的ID为起始搜索未传输第一定位消息的物联网设备(100)从而使得所述智能网关(300)与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备(100)保持通信。

7.一种基于智能网关的智慧电梯管理方法,其特征在于,所述方法包括:将基于预约信息获取的与预约人员相关的第一信息通过所述智能网关(300)传输至物联网设备(100);

至少基于所述物联网设备(100)因所述第一信息的触发而上传的关于行动路径的记载了所述物联网设备(100)的ID信息和时间信息的第二信息和记载了预约人员的位置信息和信号强度信息的第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或基于预约人员上传的记载了其位置信息的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略;

其中,智能网关(300)在服务器(200)和/或物联网设备(100)的远程配置下以周期性访问多个所述物联网设备(100)的方式请求所述物联网设备(100)反馈基于预约的第一信息产生的关于行动路径的第二信息和第一定位消息,并将第二信息和第一定位消息传输至服务器(200);

在周期性访问的过程中,基于发出所述第二信息的物联网设备(100)以逐个对比的方式搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备(100)。

8.根据权利要求7所述的智慧电梯管理方法,其特征在于,所述服务器(200)配置为按照如下方式预期电梯的调度/控制策略:获取关于预约的第一信息;

基于所述物联网设备(100)反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;

基于第一信息和电梯交通需求预期电梯的调度/控制策略。

说明书 :

一种基于智能网关的智慧电梯管理系统及方法

技术领域

[0001] 本发明涉及电梯物联网技术领域,具体涉及一种基于智能网关的智慧电梯管理系统及方法。

背景技术

[0002] 随着高层楼宇不断出现,电梯作为智能楼宇重要组成的运输工具承载大量办公人员的乘坐需求。一方面电梯作为人员聚集场所的公共工具需要保证其安全运行,另一方面由于大量人员进出频繁且呈潮汐式分布,电梯运行效率问题愈加突出。例如,在上下班高峰时段,电梯久等不来,或者过楼层不停,或者层层停靠,不仅电梯运行效率低下,无法快速疏导人流。
[0003] 例如,公开号为CN110342355A的中国专利文献公开了一种智能楼宇电梯调度平台系统及其工作方法,系统包括客户端、云端服务器、通信网关、数据采集终端、Zigbee协调器、智能网关、智能楼宇电梯群控调度总控系统和分控系统;客户端通过无线网络与云端服务器连接;客户端通过安装的软件实现调度电梯、提前预约电梯、电梯位置查看、电梯人数监视、远程预约和到站提醒;数据采集终端通过Zigbee协调器建立无线连接;Zigbee协调器与智能网关建立无线连接,智能网关依次通过路由器和TCP/IP网络接入互联网,从而与云端服务器连接;云端服务器对智能网关上传的数据通过大数据分析和云计算实现对电梯运输数据监测和分析,实时监控所有电梯的运行情况,并通过通信网关与智能楼宇电梯群控调度总控系统建立通信连接;智能楼宇电梯群调度总控系统分析出最佳停靠和运行时间,合理规划乘梯时刻,通过分控系统实现对电梯进行优化调度,减少能源消耗,实现电梯的高效运行,提高人民群众的安全性和乘坐体验。尽管该专利能够通过提前预约电梯或者远程预约等功能获取乘坐人员的目标楼层,并通过物联网等技术与底层监控电梯运行状态的传感设备建立连接,从而将目标楼层相关数据与电梯运行状态数据传输至服务器,在服务器侧通过数据分析和计算预测电梯的最佳服务路径,从而减少电梯停站次数,提高电梯运行效率,快速疏导人流。但是,在高层楼宇管理的实践中,除了常驻的办公人员在上下班高峰期间可能会造成人流聚集外,每天还有大量频繁进出的其他人员来访高层楼宇内的办公公司,而不同高层楼宇其电梯的设置位置不同、能够到达的楼层区段不同、客梯和货梯容易混淆等多种因素,导致非常驻办公人员无法快速找到能够达到目的楼层的电梯,这种来访人员到达时间的不确定性以及选择电梯的不确定性,提高了服务器计算和预测电梯服务路径的难度。另一方面,来访人员选择电梯的不确定性和非预约人员选择电梯的不确定性,又增加了电梯的非预期运行,进而导致能耗和设备磨损的增加。
[0004] 此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于发明人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。

发明内容

[0005] 针对现有技术之不足,本发明提供一种基于智能网关的智慧电梯管理系统,包括物联网设备、服务器和智能网关。所述服务器配置为:将基于预约信息获取的第一信息通过所述智能网关传输至所述物联网设备;至少基于所述物联网设备因所述第一信息的触发而上传的关于行动路径的第二信息和第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或基于预约人员上传的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略。优选地,第一信息可以包括预约人员的目的楼层、预约人员的生理信息、预约人员的权限信息、预约人员的电子设备的标识信息等。预约人员的生理信息包括人脸信息、指纹信息等。优选地,第二信息至少包括物联网设备的ID信息和时间信息。时间信息是物联网设备基于第一信息的触发而产生的时间信息。例如,当物联网设备为门禁设备时,门禁设备基于服务器传输的第一信息验证预约人员的身份。门禁设备可以通过人脸识别、指纹识别、预约人员的电子设备来验证预约人员的身份。利用预约人员的电子设备验证身份可以是服务器发送对应第一信息的二维码,在预约人员通过门禁设备时,门禁设备扫描预约人员的电子设备展示的二维码,然后进行解密,解密后的信息如果与第一信息一致则判定预约人员的身份。优选地,第一信息可以是公钥。门禁设备可以利用第一信息解密预约人员展示的二维码。优选地,所述服务器配置为至少基于所述第二信息和第二定位消息预期预约人员预期到达时间和选择的电梯。所述服务器配置为基于预期达到时间和选择的电梯动态调整电梯的调度/控制策略。现有关于电梯的智慧调度或者控制策略,无论是从能源消耗、电梯走行距离、乘梯人员等待时间等优化目标,还是从远程预约、提供电梯运行状态、安全监控等服务功能,最终制定的电梯调度/控制策略是以电梯和预约人员两者的状态为基础的,然而现有技术没有考虑到预约人员一侧的真实状态,即预约人员的到达电梯实际时间以及选择的电梯门,具有较大的不确定性,这就使得之前制定的电梯调度/控制策略不符合实际情况,如在约定的时间没有人员乘梯,电梯轿厢非预期的多承载/少承载人员。以上情况的出现均会造成电梯的非预期运行,进而增加能源消耗和设备磨损。本发明通过融合离线地第二信息和在线的第一定位消息感知预约人员的位置,即通过感知固定位置的物联网设备来非实时且离线地获取预约人员的第二信息,并通过室内定位设备获取预约人员的实时在线的位置信息,并通过物联网固定的离线位置信息对实时在线的位置信息进行纠偏,从而获取预约人员的预期达到时间和为预约人员导航以减少预约人员选择电梯的不确定性,进而服务器在制定电梯的调度/控制策略时能够将预约人员的达到时间和选择电梯的确定性融入,使得生成的调度/控制策略能够减少电梯的非预期运行,进而避免能耗增加和设备磨损的增加。
[0006] 本发明还提供一种基于智能网关的智慧电梯管理系统,包括物联网设备、服务器和智能网关。所述智能网关配置为:
[0007] 在所述服务器和/或物联网设备的远程配置下以周期性访问多个所述物联网设备的方式请求所述物联网设备反馈基于预约的第一信息产生的关于行动路径的第二信息和第一定位消息,并将第二信息和第一定位消息传输至服务器;
[0008] 在周期性访问的过程中,基于发出所述第二信息的物联网设备以逐个对比的方式搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备。
[0009] 本发明还提供一种基于智能网关的智慧电梯管理系统,包括物联网设备和智能网关。所述物联网设备配置为:
[0010] 基于所述智能网关传输的关于预约的第一信息向所述智能网关反馈关于预约人员离线路径的第二信息。在所述智能网关的指示下和/或第二信息的触发下发出射频信号和/光信号从而获取预约人员的电子设备反馈的关于在线位置的射频信号和/光信号,并将反馈的射频信号和/光信号传输至所述智能网关。
[0011] 根据一种优选实施方式,所述服务器配置为按照如下方式预期电梯的调度/控制策略:
[0012] 获取关于预约的第一信息;
[0013] 基于所述物联网设备反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;
[0014] 基于第一信息和电梯交通需求预期电梯的调度/控制策略。
[0015] 根据一种优选实施方式,所述服务器配置为基于深度强化学习/强化学习的算法获取电梯的调度/控制策略。优化目标为:等待时间最短且能源消耗最低;约束条件为:电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值;策略变量为:电梯停靠次数和走行距离。在所述深度强化学习/强化学习的更新函数中,添加以第一定位消息/第二定位消息表征的关于等待时间的损失函数。
[0016] 根据一种优选实施方式,所述智能网关配置为按照如下步骤融合第二信息和第一定位消息:
[0017] 基于发出所述第二信息的物联网设备以逐个对比的方式搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号去强度差异超过第一阈值的物联网设备。优选地,以首先发出第二信息的物联网设备的物理位置为起始,按照预先存储的以实际物理位置排序的物联网设备的ID逐个请求物联网设备反馈第一定位消息。在搜索至少两个产生所述第一定位消息且彼此第一定位消息的信号差异超过第一阈值的物联网设备的过程中,周期性地请求物联网设备反馈第二信息。若获取第二信息,则基于第二信息调整当前获取的第一定位消息以避免第一定位消息传输的位置信息偏离实际。
[0018] 根据一种优选实施方式,在多个传输第一定位消息的物联网设备中出现至少两个第一定位消息的信号强度差异超过第二阈值的情况下,所述智能网关配置为:
[0019] 屏蔽传输第一定位消息的信号强度小于第四阈值的物联网设备,并请求关闭该物联网设备;
[0020] 以该物联网设备的ID为起始搜索未传输第一定位消息的物联网设备从而使得所述智能网关与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备保持通信。
[0021] 根据一种优选实施方式,在多个传输第一定位消息的物联网设备中出现至少两个第一定位消息的信号强度差异超过第二阈值且不存在传输第一定位消息的信号强度小于第四阈值的物联网设备的情况下,所述智能网关配置为:
[0022] 屏蔽传输第一定位消息的信号强度大于第五阈值的物联网设备,并请求关闭该物联网设备;
[0023] 以该物联网设备的ID为起始搜索未传输第一定位消息的物联网设备从而使得所述智能网关与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备保持通信。
[0024] 本发明还提供一种基于智能网关的智慧电梯管理方法,所述方法包括:
[0025] 将基于预约信息获取的第一信息通过所述智能网关传输至所述物联网设备;
[0026] 至少基于所述物联网设备因所述第一信息的触发而上传的关于行动路径的第二信息和第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或[0027] 基于预约人员上传的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略。
[0028] 根据一种优选实施方式,所述服务器配置为按照如下方式预期电梯的调度/控制策略:
[0029] 获取关于预约的第一信息;
[0030] 基于所述物联网设备反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;
[0031] 基于第一信息和电梯交通需求预期电梯的调度/控制策略。

附图说明

[0032] 图1是本发明智慧电梯管理系统的一个优选实施方式的简化模块示意图;
[0033] 图2是本发明智慧电梯管理方法的一个优选实施方式的步骤流程示意图。
[0034] 附图标记列表
[0035] 100:物联网设备 200:服务器 300:智能网关

具体实施方式

[0036] 下面结合附图进行详细说明。
[0037] 电梯物联网是为了解决目前电梯安全问题而提出的概念,数据采集部分、数据传输部分、中心处理部分以及应用软件共同构成了完整的电梯物联网监控系统。采集仪采集电梯运行数据进行分析并上传到互联网监控中心,结合平台应用软件,从而实现了各相关单位对电梯实时有效的监管维护。但是,参考其他行业的智能化进程,可以发现其中存在的一些问题,其中一个很显著的特点是很多感知层的通讯接口及协议是不同统一的,难以将不同接口的感知设备接入互联网系统,而且随着物联网发展,传感、传输、应用各个层面会有大量的新技术出现,进而可能会采用不同的技术方案,如果各自接入网络,将会大大提高建设成本,这个问题存在每个智慧子系统中。如智能家居中采用Zigbee、485总线,智能灯泡的通讯类型和协议可能和智能插座不一样。电梯中也使用了如CAN、485、Zigbee、232等不同的通讯技术,每个通讯接口都会产生数据,随着智慧城市的发展,会有越多的电梯信息上传到网络平台,并且开放接口给政府监管部门。短期内统一不同行业之间的接口是不太可能的,但是行业融合又是一个趋势,因此采用智能网关300是电梯物联网、电梯智能化进程中较为可能性的一个方案。智能网关300作为网关设备,可以实现感知网络与通信网络以及不同类型网络感知网络之间的协议转换,既可以时间广域互联,也可以实现局域互联。此外智能网关300还具备设备管理功能,运营商通过智能网关300可以管理底层的各感知节点,了解节点的相关信息,并实现远程控制,从而使得电梯物联网的不同感知层融合能以较低的成本实现。
[0038] 优选地,智能网关300主要作用是实现不同类型网络之间的协议转换,即将不同的网络传输的数据包重新打包以符合将要连接的网络的通信协议。优选地,智能网关300具有多种可复用的扩展接口,至少包括2G/3G/4G/5G接口以及局部以太网接口。
[0039] 物联网设备100可以是门禁设备、室内定位设备、监控设备。物联网设备100还可以是能够采集电梯运行状态的设备。例如,物联网设备100可以是红外感应传感器、无线定位传感器、电梯内视频采集设备、电梯内的通信设备、电梯故障采集设备等等。
[0040] 优选地,服务器200可以是远程服务器,还可以是云服务器。优选地,服务器200可以用于云计算以及云存储。
[0041] 优选地,预约人员的电子设备可以是计算机设备,例如移动计算设备、笔记本、平板电脑、手机。预约人员的电子设备还可以是智能穿戴设备,例如智能手表、智能眼镜等。
[0042] 优选地,预约人员的电子设备可以通过有线或者无线的方式接入互联网、物联网、移动网络等网络。
[0043] 实施例1
[0044] 如图1所示,本发明提供一种基于智能网关的智慧电梯管理系统,包括物联网设备100、服务器200和智能网关300。服务器200配置为:将基于预约信息获取的第一信息通过智能网关300传输至物联网设备100;至少基于物联网设备100因第一信息的触发而上传的关于行动路径的第二信息和第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略;和/或基于预约人员上传的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略。优选地,第一信息可以包括预约人员的目的楼层、预约人员的生理信息、预约人员的权限信息、预约人员的电子设备的标识信息等。预约人员的生理信息包括人脸信息、指纹信息等。优选地,第二信息至少包括物联网设备100的ID信息和时间信息。时间信息是物联网设备100基于第一信息的触发而产生的时间信息。优选地,服务器200通过物联网设备100的ID信息可以获得位置信息。由于物联网设备100的位置是固定的,可以通过提前编制ID来一一映射对应物联网设备100的位置信息。例如,当物联网设备100为门禁设备时,门禁设备基于服务器200传输的第一信息验证预约人员的身份。门禁设备可以通过人脸识别、指纹识别、预约人员的电子设备来验证预约人员的身份。利用预约人员的电子设备验证身份可以是服务器200发送对应第一信息的二维码,在预约人员通过门禁设备时,门禁设备扫描预约人员的电子设备展示的二维码,然后进行解密,解密后的信息如果与第一信息一致则判定预约人员的身份。优选地,第一信息可以是公钥。门禁设备可以利用第一信息解密预约人员展示的二维码。优选地,服务器200配置为至少基于所述第二信息和第二定位消息预期预约人员预期到达时间和选择的电梯。服务器200配置为基于预期达到时间和选择的电梯动态调整电梯的调度/控制策略。优选地,第二定位消息可以是预约人员通过物联网设备100或者智能网关等可以连接服务器200的方式,主动上传其位置信息。通过以上设置方式,达到的有益效果是:
[0045] 现有技术没有考虑到电梯与位置导航的关系,一方面电梯的位置设置或者电梯规划不是规范的,预约人员可能找不到电梯,或者选择的电梯无法达到其目标楼层,因此需要位置导航功能。另一方面电梯的智慧调度和控制,不仅需要对电梯本身的运行状态的监控,更重要的是电梯智慧调度还需要预约人员的确切到达时间,从而进行规划,进而能够减少非预期计划的运行。即电梯本身运行的状态是时刻变化的,如果没有预约人员确切达到的时间,当前制定或者预期的电梯服务路径与实际不符,从而导致电梯的非预期运行,增加设备的磨损和能源的消耗。本发明的电梯管理系统利用电梯物联网,即服务器200通过感知固定的物联网设备100来非实时地且离线地获取预约人员的位置信息和时间信息。例如,当预约人员通过门禁设备时,门禁设备基于预约人员的第一信息允许预约人员通过,并将该预约人员经过门禁设备时的时间和其本身的ID反馈至服务器200,从而服务器200能够获知该预约人员的行动轨迹。服务器200可以快速规划该预约人员的导航路径,引导预约人员达到指定的电梯。同时,由于通过类似门禁设备的物联网设备100获取的预约人员的行动轨迹是非实时的离线位置信息,一方面这种获取预约人员位置信息的滞后性导致服务器200规划的导航路径可能偏离预约人员的实际行动路径,另一方面由于无法实时获取预约人员的位置信息,在预约人员偏离导航路径或者没有选择对应的电梯时,服务器200无法对预约人员进行纠偏,同时也无法对已经规划好的电梯调度方案或者控制方案进行实时调整和纠错,从而造成电梯的大量非预期运行。因此本发明利用物联网设备100中的室内定位功能获取第一定位消息或者第二定位消息来获取预约人员的实时在线的位置信息,并通过物联网固定的离线位置信息对实时在线的位置信息进行纠偏,从而获取预约人员的预期达到时间和为预约人员导航以减少预约人员选择电梯的不确定性,进而服务器200在制定电梯的调度/控制策略时能够将预约人员的达到时间和选择电梯的确定性融入,使得生成的调度/控制策略能够减少电梯的非预期运行,进而避免能耗增加和设备磨损的增加。
[0046] 优选地,服务器200配置为按照如下方式预期电梯的调度/控制策略:
[0047] 获取关于预约的第一信息;
[0048] 基于物联网设备100反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;
[0049] 基于第一信息和电梯交通需求预期电梯的调度/控制策略。优选地,第一信息包括预约人员所提供的目的地址。目的地址包括预约人员所要达到的目的楼层。优选地,服务器200可以采用模糊算法进行逻辑处理感知电梯峰值交通运行情况。服务器200还可以配置为基于电梯运行的风险预测获取电梯交通的需求。优选地,服务器200配置为基于神经网络算法将目的楼层相同或相近的乘客分配于同一台电梯,约束条件是预约人员和电梯的等待时间最短。需要说明的是通过神经网络算法获取电梯的调度/控制策略不是最优的调度/控制策略,而且由于高层楼宇电梯数量众多、承载的人流量大、不同时间段的进出情况不同,需要服务器200一侧的调度/控制策略不断地动态变化,并且能够随电梯和人流的变化实时反馈,中间的影响因素较多,因此服务器200配置为基于深度强化学习/强化学习算法获取电梯的调度/控制策略。
[0050] 优选地,强化学习的基本过程是一个马尔科夫决策过程。马尔科夫决策过程可以用状态s、动作a、状态转移概率p、状态转移奖励或回报r构成四元组表示{s,a,p,r}。对于离散时间马尔科夫决策过程,状态和动作的集合称为状态空间S和动作空间A。具体表示为状态si∈S,ai∈A。根据第t步选择的行动,状态根据概率P(st+1,st,at)从st转移到st+1。在状态转移的同时,决策主体得到1个即时奖励R(st+1,st,at)。以上表达式中的st表示为t时刻的状态。at表示为t时刻的动作。以上过程结束时累积的奖励为:
[0051] Gt=Rt+γRt+1+γ2Rt+2+…+γkRt+k=∑k=0γkRt+k  (1)
[0052] 式(1)中的Rt为时间t内累积的奖励。γ为折扣因子,取值范围在0~1之间。折扣因子用于削减远期决策对应的奖励权重。决策的最终目标是在抵达目标状态的同时实现累积奖励的最大化。
[0053] 优选地,本实施例的状态空间是由物联网设备100采集的电梯运行的状态以及预约人员的位置和达到时间等构建的。需要说明的是物联网设备100可以对等待的预约人员进行监控。服务器200对电梯的调度/控制是动作空间。本实施例电梯调度/控制的策略的优化目标为等待时间最短且能源消耗最低。优选地,可以选择与电梯和预约人员的等待时间最短以及电梯能源消耗相关的属性作为状态空间。服务器200控制电梯的动作可以作为策略变量。优选地,可以选择电梯停靠次数以及电梯的行走距离作为动作空间。优选地,强化学习的更新策略是以价值函数为基础的。优选地,可以通过约束条件评价价值函数。价值函数的变量为状态空间内的参数st和动作空间内的参数at。优选地,约束条件可以是电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值。优选地,第三阈值可以根据电梯的数量、电梯的承重规格等参数设置。本实施例中第三阈值可以是20%。
[0054] 优选地,在深度强化学习/强化学习中,更新函数如下:
[0055] Q(st+1,at+1)=Qo(st,at)+loss     (2)
[0056] 式(2)中的Q(st+1,at+1)为更新后的价值函数的价值。Qo(st,at)先前状态下的先前价值。先前价值为存储在价值表中的价值。loss为损失函数。
[0057] loss=α[Qr(st+1,at+1)‑Qo(st,at)]    (3)
[0058] 式(3)中Qr(st+1,at+1)为现实价值。α为学习速率。α取值在0~1之间。α决定了价值表更新的速率。
[0059] 优选地,现实价值包括第一约束条件下的第一现实价值和第二约束条件下的第二现实价值。第一约束条件为电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值。优选地,第二约束条件为以第一定位消息/第二定位消息表征的关于预约人员的等待时间最小。
[0060] 优选地,服务器200按照如下方式配置第一现实价值函数:
[0061] 首先基于第一约束条件和第二约束条件分别记录不同的状态和动作下对应的价值函数,并记录形成价值表。
[0062] 基于最大评估新状态下第一约束条件对应的价值函数最大的方式确定第一现实价值。优选地,第一现实价值函数为:
[0063] Qr1(st,at)=R(st,at)+γmaxQo(st+1,at+1)   (4)
[0064] 式(4)中Qr1(st,at)为第一现实价值函数。R(st,at)为执行模块300执行第一动作后对应的奖励。优选地,奖励可根据对应的策略变量具体设置,一般取值为one‑hot形式,如0、‑1、1、‑2、2等。maxQo(st+1,at+1)为执行动作后新状态在价值表中新状态对应的最大值。γ表示的是状态st采用动作at的价值与下一状态的和动作的关联的衰减程度。γ的取值范围在0~1之间。优选地,价值表为价值函数的离散记录。
[0065] 优选地,服务器200按照如下方式配置第二现实价值函数:
[0066] 优选地,基于价值表中的新环境状态下第二约束条件下价值函数的价值确定第二现实价值。优选地,第二现实价值函数为:
[0067] Qr2(st,at)=R(st,at)+γQo(st+1,at+1)    (5)
[0068] 式(5)中Qr2(st,at)表示第二现实价值函数。Qo(st+1,at+1)表示为执行动作后新状态在第二约束条件下的价值表中对应的价值。优选地,该对应的价值可以不是
[0069] 优选地,损失函数为第一现实价值和第二现实价值的线性叠加。通过在学习更新中添加预约人员的第一定位消息/第二定位消息,能够在当前的电梯的调度/控制策略中考虑预约人员的达到时间、等待时间等非可控因素,使得当前制定的调度/控制策略能够实时动态纠正以对抗电梯的非预期运行。
[0070] 实施例2
[0071] 本实施例是对实施例1的补充和/或改进,重复的内容不再赘述。
[0072] 优选地,在实施例1中的第一定位消息可以是由能够室内定位的物联网设备100生成。优选地,能够室内定位的物联网设备100可以是射频通信设备和光通信设备。射频通信设备可以利用Wi‑Fi、蓝牙、红外、超声波、超宽带、RFID技术实现定位。优选地,本实施例中射频通信设备可以采用接收信号强度(Received Signal Strength,RSS)来进行定位。优选地,射频通信设备还可以采用位置指纹的方式进行定位。预约人员的电子设备与射频通信设备连接。电子设备与射频通信设备连接的信号特征可以作为第一定位消息。电子设备与射频设备连接的信号特征包括接收信号强度、信号的多径结构、往返时间和时延等。优选地,光通信设备也可以基于接收信号强度、信号的多径结构、往返时间和时延等进行室内定位。通常光通信设备可以与电子设备的感光元件构建光通信链路。感光元件可以是电子设备的摄像头和光线传感器。具体而言,光通信设备主动发出光信号,电子设备被动接收光信号。优选地,光通信设备还可以通过图像传感器利用成像法定位。但是,射频通信设备利用接收信号强度定位,定位精度差并且接收信号的强度波动较大。射频通信设备采用位置指纹的方式进行定位,需要预先采集大量位置指纹信息以构建位置指纹数据库,当用户处于相应区域时,可以使用手机捕捉信号特征,并与数据库对比,获得定位,通常精度很高。但是数据库构建初期的工作量很大以及Wi‑Fi基站等环境一旦改变原数据库就会失效。而光通信设备进行室内定位其通信距离有限,通常在5米以内,并且误码率较高,无法保证定位的效果。
[0073] 本实施例提供一种基于智能网关的智慧电梯管理系统,包括物联网设备100、服务器200和智能网关300。智能网关300配置为:
[0074] 在服务器200和/或物联网设备100的远程配置下以周期性访问多个物联网设备100的方式请求物联网设备100反馈基于预约的第一信息产生的关于行动路径的第二信息和第一定位消息,并将第二信息和第一定位消息传输至服务器200;
[0075] 在周期性访问的过程中,基于发出第二信息的物联网设备100以逐个对比的方式搜索至少两个产生第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100。优选地,第一阈值可以根据物联网设备安装的位置和实际测量的射频信号的强度进行设置。一般,第一阈值至少为20%。本发明采用以上设置方式,达到的有益效果是:
[0076] 本发明能够融合长时间且离线地第二信息和短时间实时的第一定位消息进行定位。这种方式能够克服现有定位技术的缺陷。现有技术可以使用射频通信设备或光通信设备进行定位,但是存在以下两个问题:
[0077] 1、使用射频通信设备进行定位,一般采用接收信号强度来进行定位,这种定位方法的射频信号容易受多经衰落的影响,定位精度较差,一般超过十几米。
[0078] 2、采用位置指纹的方法,前期需要构建大量的锚点,并且需要相关的设备位置保持不变,不利于后期的维护建设。
[0079] 因此本发明通过智能网关300遍历所有的物联网设备100,以逐个对比的方式搜索第一定位消息中定位差异较大的至少两个物联网设备100,能够大幅度提高定位精度和保证定位的连续性。具体而言,第一定位消息包括预约人员的位置信息和信号强度信息。本发明首先针对信号强度进行分析,不需要对消耗计算资源进行解码才能得到位置信息进行分析,在服务器200一侧能够减少计算开销和时间成本。一方面,信号强度的不同,即当两个信号强度差异超过第一阈值,证明两个物联网设备100位置的设置针对预约人员的定位角度差异足够大,从而能够尽可能保证从不同的角度对预约人员进行定位。这种从不同的角度对预约人员进行定位的方式,使得对预约人员的定位结果多样性较强,可以为后续的定位提高可靠性。例如,当其中一个物联网设备100的信号强度不稳定出现无规律跳变的情况下,最后得到的位置信息飘忽不定,而如果采用取平均值后进行定位的方式,定位的实时效果较差。本发明利用另一个物联网设备100关于第一定位消息的信号强度作为跳变信号的基准值,以第一阈值为校正范围,剔除超过基准值的第一阈值范围外的跳变信号,然后结合卡尔曼滤波对剔除后的信号进行处理。该处理方式能够在保证实时效果的基础上提高定位信号的可靠性。
[0080] 另一方面,在信号强度稳定的情况下,两个不同信号强度的第一定位消息,通过两者的重叠定位范围作为预约人员的位置,能够大幅度地提高定位精度。而且,单个物联网设备100的定位精度较差,对预约人员的移动不敏感。由于两个物联网设备100的位置是已知的,因此当两个物联网设备100的信号强度的差异持续稳定变化时,能够快速感知预约人员的移动。
[0081] 此外,由于物联网设备100的位置是固定的,其定位的通信距离有限,而预约人员的行动路径很有可能脱离物联网设备100的通信距离,因此本发明采用逐个搜索信号强度差异超过第一阈值的方式进行定位,一方面能够保证在对预约人员定位期间保持两个不同信号强度第一定位消息的连续性,从而减少定位误差和保证定位的实时性。另一方面可以利用不同的物联网设备实际的物理位置信息,提供不同角度的定位结果来提高可靠性。
[0082] 优选地,智能网关300配置为按照如下步骤融合第二信息和第一定位消息:
[0083] 基于发出第二信息的物联网设备100以逐个对比的方式搜索至少两个产生第一定位消息且彼此第一定位消息的信号去强度差异超过第一阈值的物联网设备100。优选地,以首先发出第二信息的物联网设备100的物理位置为起始,按照预先存储的以实际物理位置排序的物联网设备100的ID逐个请求物联网设备100反馈第一定位消息。在搜索至少两个产生第一定位消息且彼此第一定位消息的信号差异超过第一阈值的物联网设备100的过程中,周期性地请求物联网设备100反馈第二信息。若获取第二信息,则基于第二信息调整当前获取的第一定位消息以避免第一定位消息传输的位置信息偏离实际。
[0084] 如果传输的信号强度差异过大,那么对减少定位精度误差无意义,而且信号强度过强,其波动的范围更大,从而导致后续的根据另一个定位信号作为基准来进行卡尔曼滤波时,导致大部分的信号不在第一阈值范围内,从而使得大部分的信号被滤掉。
[0085] 优选地,在多个传输第一定位消息的物联网设备100中出现至少两个第一定位消息的信号强度差异超过第二阈值的情况下,智能网关300配置为:
[0086] 屏蔽传输第一定位消息的信号强度小于第四阈值的物联网设备100,并请求关闭该物联网设备100;
[0087] 以该物联网设备100的ID为起始搜索未传输第一定位消息的物联网设备100从而使得智能网关300与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100保持通信。优选地,第二阈值为50%。第四阈值可以根据实际的物联网设备100的位置和安装参数设置。优选地,一般第四阈值的为‑70~‑85dBm。
[0088] 优选地,在多个传输第一定位消息的物联网设备100中出现至少两个第一定位消息的信号强度差异超过第二阈值且不存在传输第一定位消息的信号强度小于第四阈值的物联网设备100的情况下,智能网关300配置为:
[0089] 屏蔽传输第一定位消息的信号强度大于第五阈值的物联网设备100,并请求关闭该物联网设备100;
[0090] 以该物联网设备100的ID为起始搜索未传输第一定位消息的物联网设备100从而使得智能网关300与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100保持通信。优选地,第五阈值可以根据室内的结构和物联网设备100的具体位置而设定。一般地,如果采用Wi‑Fi信号进行定位的情况下,第五阈值可以在‑
45dBm以上。通过该设置方式,达到的有益效果是:
[0091] 使得物联网设备100反馈的第一定位消息信号的强度保持在第四阈值和第五阈值之间,并且至少两个第一定位消息信号的强度差异保持在第一阈值和第二阈值之间,从而避免信号波动过大导致大部分的信号被过滤掉。
[0092] 实施例3
[0093] 本发明还提供一种基于智能网关的智慧电梯管理方法。如图2所示,方法包括如下步骤:
[0094] S100:将基于预约信息获取的第一信息通过智能网关300传输至物联网设备100。优选地,第一信息可以包括预约人员的目的楼层、预约人员的生理信息、预约人员的权限信息、预约人员的电子设备的标识信息等。预约人员的生理信息包括人脸信息、指纹信息等。
[0095] S200:在服务器200和/或物联网设备100的远程配置下以周期性访问多个物联网设备100的方式请求物联网设备100反馈基于预约的第一信息产生的关于行动路径的第二信息和第一定位消息,并将第二信息和第一定位消息传输至服务器200。在周期性访问的过程中,基于发出第二信息的物联网设备100以逐个对比的方式搜索至少两个产生第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100。优选地,第一阈值可以根据物联网设备安装的位置和实际测量的射频信号的强度进行设置。一般,第一阈值至少为20%。本发明采用以上设置方式,达到的有益效果是:
[0096] 本发明通过智能网关300遍历所有的物联网设备100,以逐个对比的方式搜索第一定位消息中定位差异较大的至少两个物联网设备100,能够大幅度提高定位精度和保证定位的连续性。具体而言,第一定位消息包括预约人员的位置信息和信号强度信息。本发明首先针对信号强度进行分析,不需要对消耗计算资源进行解码才能得到位置信息进行分析,在服务器200一侧能够减少计算开销和时间成本。一方面,信号强度的不同,即当两个信号强度差异超过第一阈值,证明两个物联网设备100位置的设置针对预约人员的定位角度差异足够大,从而能够尽可能保证从不同的角度对预约人员进行定位。这种从不同的角度对预约人员进行定位的方式,使得对预约人员的定位结果多样性较强,可以为后续的定位提高可靠性。例如,当其中一个物联网设备100的信号强度不稳定出现无规律跳变的情况下,最后得到的位置信息飘忽不定,而如果采用取平均值后进行定位的方式,定位的实时效果较差。本发明利用另一个物联网设备100关于第一定位消息的信号强度作为跳变信号的基准值,以第一阈值为校正范围,剔除超过基准值的第一阈值范围外的跳变信号,然后结合卡尔曼滤波对剔除后的信号进行处理。该处理方式能够在保证实时效果的基础上提高定位信号的可靠性。
[0097] 另一方面,在信号强度稳定的情况下,两个不同信号强度的第一定位消息,通过两者的重叠定位范围作为预约人员的位置,能够大幅度地提高定位精度。而且,单个物联网设备100的定位精度较差,对预约人员的移动不敏感。由于两个物联网设备100的位置是已知的,因此当两个物联网设备100的信号强度的差异持续稳定变化时,能够快速感知预约人员的移动。
[0098] 此外,由于物联网设备100的位置是固定的,其定位的通信距离有限,而预约人员的行动路径很有可能脱离物联网设备100的通信距离,因此本发明采用逐个搜索信号强度差异超过第一阈值的方式进行定位,一方面能够保证在对预约人员定位期间保持两个不同信号强度第一定位消息的连续性,从而减少定位误差和保证定位的实时性。另一方面可以利用不同的物联网设备实际的物理位置信息,提供不同角度的定位结果来提高可靠性。
[0099] 优选地,智能网关300配置为按照如下步骤融合第二信息和第一定位消息:
[0100] 基于发出第二信息的物联网设备100以逐个对比的方式搜索至少两个产生第一定位消息且彼此第一定位消息的信号去强度差异超过第一阈值的物联网设备100。优选地,以首先发出第二信息的物联网设备100的物理位置为起始,按照预先存储的以实际物理位置排序的物联网设备100的ID逐个请求物联网设备100反馈第一定位消息。在搜索至少两个产生第一定位消息且彼此第一定位消息的信号差异超过第一阈值的物联网设备100的过程中,周期性地请求物联网设备100反馈第二信息。若获取第二信息,则基于第二信息调整当前获取的第一定位消息以避免第一定位消息传输的位置信息偏离实际。
[0101] 如果传输的信号强度差异过大,那么对减少定位精度误差无意,而且信号强度过强,其波动的范围更大,从而导致后续的根据另一个定位信号作为基准来进行卡尔曼滤波时,导致大部分的信号不在第一阈值范围内,从而使得大部分的信号被滤掉。
[0102] 优选地,在多个传输第一定位消息的物联网设备100中出现至少两个第一定位消息的信号强度差异超过第二阈值的情况下,智能网关300配置为:
[0103] 屏蔽传输第一定位消息的信号强度小于第四阈值的物联网设备100,并请求关闭该物联网设备100;
[0104] 以该物联网设备100的ID为起始搜索未传输第一定位消息的物联网设备100从而使得智能网关300与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100保持通信。优选地,第二阈值为50%。第四阈值可以根据实际的物联网设备100的位置和安装参数设置。优选地,一般第四阈值的为‑70~‑85dBm。
[0105] 优选地,在多个传输第一定位消息的物联网设备100中出现至少两个第一定位消息的信号强度差异超过第二阈值且不存在传输第一定位消息的信号强度小于第四阈值的物联网设备100的情况下,智能网关300配置为:
[0106] 屏蔽传输第一定位消息的信号强度大于第五阈值的物联网设备100,并请求关闭该物联网设备100;
[0107] 以该物联网设备100的ID为起始搜索未传输第一定位消息的物联网设备100从而使得智能网关300与至少两个传输第一定位消息且彼此第一定位消息的信号强度差异超过第一阈值的物联网设备100保持通信。优选地,第五阈值可以根据室内的结构和物联网设备100的具体位置而设定。一般地,如果采用Wi‑Fi信号进行定位的情况下,第五阈值可以在‑
45dBm以上。通过该设置方式,达到的有益效果是:
[0108] 使得物联网设备100反馈的第一定位消息信号的强度保持在第四阈值和第五阈值之间,并且至少两个第一定位消息信号的强度差异保持在第一阈值和第二阈值之间,从而避免信号波动过大导致大部分的信号被过滤掉。
[0109] S300:至少基于物联网设备100因第一信息的触发而上传的关于行动路径的第二信息和第一定位消息为预约人员规划导航路径和动态调整电梯的调度/控制策略。和/或基于预约人员上传的第二定位消息为预约人员进行导航以及动态调整电梯的调度/控制策略。优选地,第二信息至少包括物联网设备100的ID信息和时间信息。时间信息是物联网设备100基于第一信息的触发而产生的时间信息。优选地,服务器200通过物联网设备100的ID信息可以获得位置信息。由于物联网设备100的位置是固定的,可以通过提前编制ID来一一映射对应物联网设备100的位置信息。例如,当物联网设备100为门禁设备时,门禁设备基于服务器200传输的第一信息验证预约人员的身份。门禁设备可以通过人脸识别、指纹识别、预约人员的电子设备来验证预约人员的身份。利用预约人员的电子设备验证身份可以是服务器200发送对应第一信息的二维码,在预约人员通过门禁设备时,门禁设备扫描预约人员的电子设备展示的二维码,然后进行解密,解密后的信息如果与第一信息一致则判定预约人员的身份。优选地,第一信息可以是公钥。门禁设备可以利用第一信息解密预约人员展示的二维码。优选地,服务器200配置为至少基于所述第二信息和第二定位消息预期预约人员预期到达时间和选择的电梯。服务器200配置为基于预期达到时间和选择的电梯动态调整电梯的调度/控制策略。优选地,第二定位消息可以是预约人员通过物联网设备100或者智能网关等可以连接服务器200的方式,主动上传其位置信息。通过以上设置方式,达到的有益效果是:
[0110] 现有技术没有考虑到电梯与位置导航的关系,一方面电梯的位置设置或者电梯规划不是规范的,预约人员可能找不到电梯,或者选择的电梯无法达到其目标楼层,因此需要位置导航功能。另一方面电梯的智慧调度和控制,不仅需要对电梯本身的运行状态的监控,更重要的是电梯智慧调度还需要预约人员的确切到达时间,从而进行规划,进而能够减少非预期计划的运行。即电梯本身运行的状态是时刻变化的,如果没有预约人员确切达到的时间,当前制定或者预期的电梯服务路径与实际不符,从而导致电梯的非预期运行,增加设备的磨损和能源的消耗。本发明的电梯管理系统利用电梯物联网,即服务器200通过感知固定的物联网设备100来非实时地且离线地获取预约人员的位置信息和时间信息。例如,当预约人员通过门禁设备时,门禁设备基于预约人员的第一信息允许预约人员通过,并将该预约人员经过门禁设备时的时间和其本身的ID反馈至服务器200,从而服务器200能够获知该预约人员的行动轨迹。服务器200可以快速规划该预约人员的导航路径,引导预约人员达到指定的电梯。同时,由于通过类似门禁设备的物联网设备100获取的预约人员的行动轨迹是非实时的离线位置信息,一方面这种获取预约人员位置信息的滞后性导致服务器200规划的导航路径可能偏离预约人员的实际行动路径,另一方面由于无法实时获取预约人员的位置信息,在预约人员偏离导航路径或者没有选择对应的电梯时,服务器200无法对预约人员进行纠偏,同时也无法对已经规划好的电梯调度方案或者控制方案进行实时调整和纠错,从而造成电梯的大量非预期运行。因此本发明利用物联网设备100中的室内定位功能获取第一定位消息或者第二定位消息来获取预约人员的实时在线的位置信息,并通过物联网固定的离线位置信息对实时在线的位置信息进行纠偏,从而获取预约人员的预期达到时间和为预约人员导航以减少预约人员选择电梯的不确定性,进而服务器200在制定电梯的调度/控制策略时能够将预约人员的达到时间和选择电梯的确定性融入,使得生成的调度/控制策略能够减少电梯的非预期运行,进而避免能耗增加和设备磨损的增加。
[0111] 优选地,服务器200配置为按照如下方式预期电梯的调度/控制策略:
[0112] 获取关于预约的第一信息;
[0113] 基于物联网设备100反馈的实时电梯运行状态和历史电梯运行状态预测电梯交通需求;
[0114] 基于第一信息和电梯交通需求预期电梯的调度/控制策略。优选地,第一信息包括预约人员所提供的目的地址。目的地址包括预约人员所要达到的目的楼层。优选地,服务器200可以采用模糊算法进行逻辑处理感知电梯峰值交通运行情况。服务器200还可以配置为基于电梯运行的风险预测获取电梯交通的需求。优选地,服务器200配置为基于神经网络算法将目的楼层相同或相近的乘客分配于同一台电梯,约束条件是预约人员和电梯的等待时间最短。需要说明的是通过神经网络算法获取电梯的调度/控制策略不是最优的调度/控制策略,而且由于高层楼宇电梯数量众多、承载的人流量大、不同时间段的进出情况不同,需要服务器200一侧的调度/控制策略不断地动态变化,并且能够随电梯和人流的变化实时反馈,中间的影响因素较多,因此服务器200配置为基于深度强化学习/强化学习算法获取电梯的调度/控制策略。
[0115] 优选地,强化学习的基本过程是一个马尔科夫决策过程。马尔科夫决策过程可以用状态s、动作a、状态转移概率p、状态转移奖励或回报r构成四元组表示{s,a,p,r}。对于离散时间马尔科夫决策过程,状态和动作的集合称为状态空间S和动作空间A。具体表示为状态si∈S,ai∈A。根据第t步选择的行动,状态根据概率P(st+1,st,at)从st转移到st+1。在状态转移的同时,决策主体得到1个即时奖励R(st+1,st,at)。以上表达式中的st表示为t时刻的状态。at表示为t时刻的动作。以上过程结束时累积的奖励为:
[0116] Gt=Rt+γRt+1+γ2Rt+2+…+γkRt+k=∑k=0γkRt+k  (1)
[0117] 式(1)中的Rt为时间t内累积的奖励。γ为折扣因子,取值范围在0~1之间。折扣因子用于削减远期决策对应的奖励权重。决策的最终目标是在抵达目标状态的同时实现累积奖励的最大化。
[0118] 优选地,本实施例的状态空间是由物联网设备100采集的电梯运行的状态以及预约人员的位置和达到时间等构建的。需要说明的是物联网设备100可以对等待的预约人员进行监控。服务器200对电梯的调度/控制是动作空间。本实施例电梯调度/控制的策略的优化目标为等待时间最短且能源消耗最低。优选地,可以选择与电梯和预约人员的等待时间最短以及电梯能源消耗相关的属性作为状态空间。服务器200控制电梯的动作可以作为策略变量。优选地,可以选择电梯停靠次数以及电梯的行走距离作为动作空间。优选地,强化学习的更新策略是以价值函数为基础的。优选地,可以通过约束条件评价价值函数。价值函数的变量为状态空间内的参数st和动作空间内的参数at。优选地,约束条件可以是电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值。优选地,第三阈值可以根据电梯的数量、电梯的承重规格等参数设置。本实施例中第三阈值可以是20%。
[0119] 优选地,在深度强化学习/强化学习中,更新函数如下:
[0120] Q(st+1,at+1)=Qo(st,at)+loss     (2)
[0121] 式(2)中的Q(st+1,at+1)为更新后的价值函数的价值。Qo(st,at)先前状态下的先前价值。先前价值为存储在价值表中的价值。loss为损失函数。
[0122] loss=α[Qr(st+1,at+1)‑Qo(st,at)]    (3)
[0123] 式(3)中Qr(st+1,at+1)为现实价值。α为学习速率。α取值在0~1之间。α决定了价值表更新的速率。
[0124] 优选地,现实价值包括第一约束条件下的第一现实价值和第二约束条件下的第二现实价值。第一约束条件为电梯运行效率不减少且多个电梯轿厢载重差异小于第三阈值。优选地,第二约束条件为以第一定位消息/第二定位消息表征的关于预约人员的等待时间最小。
[0125] 优选地,服务器200按照如下方式配置第一现实价值函数:
[0126] 首先基于第一约束条件和第二约束条件分别记录不同的状态和动作下对应的价值函数,并记录形成价值表。
[0127] 基于最大评估新状态下第一约束条件对应的价值函数最大的方式确定第一现实价值。优选地,第一现实价值函数为:
[0128] Qr1(st,at)=R(st,at)+γmaxQo(st+1,at+1)   (4)
[0129] 式(4)中Qr1(st,at)为第一现实价值函数。R(st,at)为执行模块300执行第一动作后对应的奖励。优选地,奖励可根据对应的策略变量具体设置,一般取值为one‑hot形式,如0、‑1、1、‑2、2等。maxQo(st+1,at+1)为执行动作后新状态在价值表中新状态对应的最大值。γ表示的是状态st采用动作at的价值与下一状态的和动作的关联的衰减程度。γ的取值范围在0~1之间。优选地,价值表为价值函数的离散记录。
[0130] 优选地,服务器200按照如下方式配置第二现实价值函数:
[0131] 优选地,基于价值表中的新环境状态下第二约束条件下价值函数的价值确定第二现实价值。优选地,第二现实价值函数为:
[0132] Qr2(st,at)=R(st,at)+γQo(st+1,at+1)    (5)
[0133] 式(5)中Qr2(st,at)表示第二现实价值函数。Qo(st+1,at+1)表示为执行动作后新状态在第二约束条件下的价值表中对应的价值。优选地,该对应的价值可以不是
[0134] 优选地,损失函数为第一现实价值和第二现实价值的线性叠加。通过在学习更新中添加预约人员的第一定位消息/第二定位消息,能够在当前的电梯的调度/控制策略中考虑预约人员的达到时间、等待时间等非可控因素,使得当前制定的调度/控制策略能够实时动态纠正以对抗电梯的非预期运行。
[0135] 本发明说明书包含多项发明构思,申请人保留根据每项发明构思提出分案申请的权利。本发明说明书包含多项发明构思,诸如“优选地”、“根据一个优选实施方式”或“可选地”均表示相应段落公开了一个独立的构思,申请人保留根据每项发明构思提出分案申请的权利。
[0136] 需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。