一种基于物联网数据中台的数据处理方法及系统转让专利

申请号 : CN202110136094.5

文献号 : CN112948845B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郭禄鹏李超张强

申请人 : 航天科技控股集团股份有限公司

摘要 :

本发明公开了一种基于物联网数据中台的数据处理方法及系统,通过设计三级数据处理结构,在采集端设置初步的设定和筛选,数据导向也设置有两级,采集端可以根据采集的数据安全性及处理紧急性而选择由数据处理平台还是对应的特别数据处理点进行数据处理。同时,对于数据的生成者、使用者和处理者进行记录,对三者分别授予不同的权限,在进行数据处理的过程中,实时监控数据处理过程中需要用到的权限,若权限对应不匹配,则明显说明数据存在安全问题。而如果在采集端设计多级数据处理端则会增加数据传输的时效性下降,而本申请可以完全解决这一问题,通过快速匹配和标记设定规则对预处理数据进行快速分类和第一步处理。

权利要求 :

1.一种基于物联网数据中台的数据处理方法,其特征在于,所述数据处理方法包括如下步骤:

步骤1,构建分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元;

步骤2,设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;

步骤3,数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性;

步骤4,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点;

步骤5,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。

2.如权利要求1所述的一种基于物联网数据中台的数据处理方法,其特征在于,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。

3.如权利要求2所述的一种基于物联网数据中台的数据处理方法,其特征在于,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。

4.如权利要求3所述的一种基于物联网数据中台的数据处理方法,其特征在于,若所述第一特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。

5.如权利要求1所述的一种基于物联网数据中台的数据处理方法,其特征在于,所述步骤1中的所述分布式采集点与所属数据处理平台通过网络进行连接进一步包括:

所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。

6.一种基于物联网数据中台的数据处理系统,其特征在于,所述数据处理系统包括:分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元,规则设定模块设置于所述分布式采集点和数据处理平台之间,通过所述规则设定模块设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;安全判断模块,所述数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。

7.如权利要求6所述的一种基于物联网数据中台的数据处理系统,其特征在于,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。

8.如权利要求7所述的一种基于物联网数据中台的数据处理系统,其特征在于,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。

9.如权利要求8所述的一种基于物联网数据中台的数据处理系统,其特征在于,若所述第一特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。

10.如权利要求6所述的一种基于物联网数据中台的数据处理系统,其特征在于,所述分布式采集点和数据处理平台的链接关系进一步包括:所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。

说明书 :

一种基于物联网数据中台的数据处理方法及系统

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种基于物联网数据中台的数据处理方法及系统。

背景技术

[0002] 最近几年,随着工业互联网和工业物联网技术的迅猛发展,大数据在互联网工业的舞台上发挥了重要作用。在工业物联网领域往往存在大量的需要进行监控的监控点或者监控设备,对这些监控点或者监控设备检测到的实时数据都需要及时的上传至云端服务器,因此需要涉及到远程数据进行采集,而不同的设备数据往往会通过不同的协议将数据传送到网关。
[0003] 现有的工业数据采集方案在遇到由不同协议发送来的数据时,想要通过网关将这些数据上传至云端服务器通常会有两种解决方案,一种是,增加多个网关设备对不同协议传输的数据进行一对一解析后上传。采用这种方案时网关设备的通用性不强,需要不同的网关设备对数据进行解析。另一种是,在网关前增加设备将不同协议传递的数据转换为统一协议传递的数据,但是这样做需要额外的设备对数据进行协议转换。
[0004] 可见,上述的两种方案都是对采集到的数据进行整包透传,针对性地获取需要的数据,而大量的不必要数据在传输时会造成不必要的流量成本。
[0005] 采集端的数据的安全性也不能得到保证,在大数据处理过程中,由于数据的易予性,对于单一功能的采集端很难保证数据的安全性,对于别有用心的人而言,在获取特定采集点的采集数据后很容易做出针对性决策而对用户不利,本申请通过设计三级数据处理结构,在采集端设置初步的设定和筛选,数据导向也设置有两级,采集端可以根据采集的数据安全性及处理紧急性而选择由数据处理平台还是对应的特别数据处理点进行数据处理。同时,对于数据的生成者、使用者和处理者进行记录,对三者分别授予不同的权限,在进行数据处理的过程中,实时监控数据处理过程中需要用到的权限,若权限对应不匹配,则明显说明数据存在安全问题。而如果在采集端设计多级数据处理端则会增加数据传输的时效性下降,而本申请可以完全解决这一问题,通过快速匹配和标记设定规则对预处理数据进行快速分类和第一步处理。

发明内容

[0006] 本发明旨在至少解决现有技术中存在的技术问题。为此,本发明公开了一种基于物联网数据中台的数据处理方法,所述数据处理方法包括如下步骤:
[0007] 步骤1,构建分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元;
[0008] 步骤2,设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;
[0009] 步骤3,数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性;
[0010] 步骤4,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点;
[0011] 步骤5,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。
[0012] 更进一步地,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。
[0013] 更进一步地,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。
[0014] 更进一步地,若所述第一特特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。
[0015] 更进一步地,所述步骤1中的所述分布式采集点与所属数据处理平台通过网络进行连接进一步包括:
[0016] 所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。
[0017] 本发明还公开了一种基于物联网数据中台的数据处理系统,所述数据处理系统包括:分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元,规则设定模块设置于所述分布式采集点和数据处理平台之间,通过所述规则设定模块设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;安全判断模块,所述数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。
[0018] 更进一步地,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。
[0019] 更进一步地,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。
[0020] 更进一步地,若所述第一特特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。
[0021] 更进一步地,所述分布式采集点和数据处理平台的链接关系进一步包括:所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。
[0022] 针对现有技术,本发明的有益效果非常显著,不需要设置特别复杂的数据加密结构和算法,同时减少了变量表引起的链接导向问题,本申请通过设计三级数据处理结构,在采集端设置初步的设定和筛选,数据导向也设置有两级,采集端可以根据采集的数据安全性及处理紧急性而选择由数据处理平台还是对应的特别数据处理点进行数据处理。同时,对于数据的生成者、使用者和处理者进行记录,对三者分别授予不同的权限,在进行数据处理的过程中,实时监控数据处理过程中需要用到的权限,若权限对应不匹配,则明显说明数据存在安全问题。而如果在采集端设计多级数据处理端则会增加数据传输的时效性下降,而本申请可以完全解决这一问题,通过快速匹配和标记设定规则对预处理数据进行快速分类和第一步处理。

附图说明

[0023] 从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在图中,在不同的视图中,相同的附图标记指定对应的部分。
[0024] 图1是本发明的基于物联网数据中台的数据处理方法的流程图。

具体实施方式

[0025] 实施例一
[0026] 如图1所示,本实施例提供了一种基于物联网数据中台的数据处理方法,所述数据处理方法包括如下步骤:
[0027] 步骤1,构建分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元;
[0028] 步骤2,设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;
[0029] 步骤3,数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性;
[0030] 步骤4,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点;
[0031] 步骤5,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。
[0032] 更进一步地,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。
[0033] 更进一步地,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。
[0034] 更进一步地,若所述第一特特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。
[0035] 更进一步地,所述步骤1中的所述分布式采集点与所属数据处理平台通过网络进行连接进一步包括:
[0036] 所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。
[0037] 实施例2
[0038] 本发明还公开了一种基于物联网数据中台的数据处理系统,所述数据处理系统包括:分布式采集点和数据处理平台,所述分布式采集点与所述数据处理平台通过网络进行连接,其中,所述分布式采集点为物联网采集终端和初步数据筛选标识单元,规则设定模块设置于所述分布式采集点和数据处理平台之间,通过所述规则设定模块设置所述分布式采集点的数据处理规则,所述数据处理规则通过数据标识位表征,所述分布式采集点根据采集到的数据标识选择数据的数据处理方向,若所述初步数据筛选标识单元检测到标识位为第一数据规则,则所述采集点直接通过网络将数据传输至对应受理点,在受理点完成数据处理有将数据处理结果和数据处理日志发送至所述数据处理平台;若检测到标识位第二数据规则,则所述采集点将采集数据发送至数据处理中台,然后删除所述采集点的缓存采集数据并生成第一伪装数据,所述数据处理平台接收到待处理数据后,生成数据处理结果和对应的处理日志;安全判断模块,所述数据处理平台根据接收到的数据处理日志提取数据日志中的采集端和处理端的操作过程,所述数据处理平台根据预先存储于设备权限库中的设备权限判断所述采集端和处理端的操作合法性,当检测到采集端和处理端的操作过程需要的权限大于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作不合法,所述数据处理平台生成第二伪装数据并反向将该第二伪装数据传输至对应的分布式采集点,当检测到采集端和处理端的操作过程需要的权限小于预先存储于所述设备权限库相应设备对应的权限时,则判断所述采集端和处理端的操作合法,所述数据处理平台允许采集数据进行数据发布。
[0039] 更进一步地,所述初步数据筛选标识单元进一步具有数据清洗和数据规则匹配功能,所述初步数据筛选标识单元在对数据进行预处理后,对预处理后的数据通过正则匹配得到判断采集的数据对应的安全等级,其中,所述正则匹配规则为在对应的安全等级和字符串列表中设置锚点,每个所述锚点为每个安全等级的第一条关键字符串,所述初步数据筛选标识单元对预处理后的数据先根据数据的第一特征选择数据的正则匹配锚点,再对数据进行相应的标识,其中,所述标识为在标识位中设置与安全等级对应的数据处理规则标识。
[0040] 更进一步地,所述第一特征为数据的长度和数据复杂度,所述复杂度表现为数据字符的分布,即数据字符在字符表上的分布越不规律则判断采集数据越复杂。
[0041] 更进一步地,若所述第一特特征的数据长度越长或者越复杂,则越选择低安全级别的正则匹配锚点。
[0042] 更进一步地,所述分布式采集点和数据处理平台的链接关系进一步包括:所述分布式采集点通过采集终端的通信端口与工业生产单元建立无线通信;实时监听所述工业生产单元采集的数据,初步数据筛选标识单元对所述采集数据进行数据清洗和数据标识;对完成数据解析的工业数据进行协议转换,并传递给云端服务器。
[0043] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0044] 本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0045] 虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。