一种yarn支持混合运行时的方法转让专利
申请号 : CN202110386215.1
文献号 : CN112769964B
文献日 : 2021-07-02
发明人 : 陈志民 , 万成
申请人 : 江苏红网技术股份有限公司
摘要 :
权利要求 :
1.一种yarn支持混合运行时的方法, 其特征在于:包括以下步骤:S1,构建数据处理服务器集群,首先构建若干数据处理服务器,且各数据处理服务器之间相互并联,并使各数据处理服务器通过智能网关与至少一个中继服务器建立数据连接,并构成数据处理服务器集群,同时为中继服务器分配至少一个Master节点,同时为中继服务器分配至少一个slave节点,并使中继服务器通过智能网关与外部网络系统建立数据连接;
S2,容器设置,完成S1步骤后,在S1步骤中的各中继服务器中,首先录入基于卷积神经网络的操控平台,然后为中继服务器设至少两个独立数据存储空间,同时设置资源调度管理器模块、节点管理器模块、yarn服务代理服务器、资源使用分析模块和虚拟化服务器,同时在Master节点处安装Flannel网络服务插件和Kubernetes网络服务管理插件,最后在Master节点设置数据库系统、镜像仓库服务系统及管理门户系统,并使各数据存储空间、资源调度管理器模块、节点管理器模块、yarn服务代理服务器、资源使用分析模块和虚拟化服务器、Flannel网络服务插件、Kubernetes网络服务管理插件、数据库系统、镜像仓库服务系统及管理门户系统分别与基于卷积神经网络的操控平台建立数据连接;
S3,系统设置,完成S2步骤,在中继服务器中首先配置基于prometheus监控报警系统、基于zookeeper的分布式应用程序协调服务系统、hadoop底层操控系统,并使基于prometheus监控报警系统、基于zookeeper的分布式应用程序协调系统及hadoop底层操控系统均与基于卷积神经网络的操控平台建立数据连接;然后在中继服务器中搭建hadoop集群,并在hadoop集群中根据任务特点构建若干yarn队列、同时为各yarn队列设置相应的配置参数及控制yarn队列刷新控制文件;最后在中继服务器中部署前后台tomcat服务器,即可完成系统配置;
S4,系统运行,完成S3步骤后,首先将待处理数据通过智能网关传输至中继服务器中,然后由中继服务器通过hadoop集群对接收的数据缓存,并通过前后台tomcat服务器对数据进行运行展示,并对接收的数据特点、数据所占用资源量进行评估,并根据数据特点及各类数据类别设定相应的yarn队列,然后通过hadoop集群对数据进行解析处理,并在解析处理过程中为yarn队列分别分配独立的运行资源,并最终通过前后台tomcat服务器对处理结果输出,同时将处理结果保存在数据处理服务器集群中相应的数据处理服务器中;
S5,系统修整,在S4步骤运行过程中,通过基于卷积神经网络的操控平台对中继服务器接收的各类数据处理过程进行同步监控,并对采集数据进行深度学习识别,形成相应的数据处理策略,并将数据处理策略保存在数据处理服务器中,同时将数据处理策略在中继服务器的hadoop集群中生成同步映像文件,并与各yarn队列对应匹配,并在后续同类数据处理时,直接通过数据处理策略自主调用相应资源即可实现自主数据处理和简化数据处理时硬件资源占用量。
2.根据权利要求1所述的一种yarn支持混合运行时的方法,其特征在于:S1步骤中,所述数据处理服务器集群中数据处理服务器为CISC服务器、RISC服务器中的任意一种或几种共用。
3.根据权利要求1所述的一种yarn支持混合运行时的方法,其特征在于:S2步骤中,基于卷积神经网络的操控平台为基于BP神经网络系统、CNN卷积神经网络系统中的任意一种或两种共用,且所述基于卷积神经网络的操控平台另设基于LSTM的智能预测系统的深度学习神经网络系统。
4.根据权利要求1所述的一种yarn支持混合运行时的方法,其特征在于:S3步骤中,yarn队列分为若干层级运行,每一层级中yarn队列均位于中继服务器中相应的独立数据存储空间中,且每一层级中各yarn队列所分配资源量总和占独立数据存储空间中资源量
80%—100%。
5.根据权利要求1所述的一种yarn支持混合运行时的方法,其特征在于:S4步骤中,待处理数据在传输至中继服务器中后,首先通过基于prometheus监控报警系统对接收数据进行辨识比对,然后由hadoop底层操控系统驱动基于zookeeper的分布式应用程序协调服务系统运行,由基于zookeeper的分布式应用程序协调服务系统根据接收数据特点对数据进行识别调度作业,然后基于yarn队列分别对特定类别数据进行处理,并在处理过程中通过基于prometheus监控报警系统对数据处理过程进行监控。
6.根据权利要求1所述的一种yarn支持混合运行时的方法,其特征在于:S3步骤中,经过系统配置后得到的yarn支持混合运行系统包括前后台tomcat服务器主系统、hadoop底层操控系统、资源调度管理器子系统、节点管理器模块子系统、yarn服务代理服务器子系统、资源使用分析子系统、虚拟化服务器子系统、基于prometheus监控报警系统、基于zookeeper的分布式应用程序协调服务系统及hadoop集群子系统,其中所述前后台tomcat服务器主系统、hadoop底层操控系统相互连接,且前后台tomcat服务器主系统、hadoop底层操控系统通过基于prometheus监控报警系统、基于zookeeper的分布式应用程序协调服务系统与hadoop集群子系统建立数据连接,所述资源调度管理器子系统、节点管理器模块子系统、yarn服务代理服务器子系统、资源使用分析子系统、虚拟化服务器子系统均嵌于hadoop集群子系统中。
7.根据权利要求6所述的一种yarn支持混合运行时的方法,其特征在于:所述的虚拟化服务器子系统另与前后台tomcat服务器主系统、hadoop底层操控系统建立数据连接。
8.根据权利要求6所述的一种yarn支持混合运行时的方法,其特征在于:所述的hadoop集群子系统为两个及两个以上时,各hadoop集群子系统间并联。
说明书 :
一种yarn支持混合运行时的方法
技术领域
背景技术
理作业,虽然当前的数据处理系统及方法可以一定程度上满足使用的需要,但在运行过程
中一方面存在系统构成结构复杂、系统构建及维护作业难度及劳动强度大,且运行成本相
对较高;另一方面各hadoop集群运行时往往均需要配置相应的硬件系统进行支撑,在进一
步导致当前系统运行和维护成本较高的同时,也造成了在数据处理高峰时硬件资源分配紧
张,在增加系统运行成本的同时,也导致数据处理运行作业效率受到极大影响,而在系统空
闲阶段时,极易造成大量硬件设备资源处于闲置状态,从而造成了大量的资源浪费,因此当
前的数据处理系统在运行时存在较大不足,在影响数据处理运行效率的同时,也导致了大
量资源浪费,进一步增加了系统运行成本。
数据处理自动化和智能化程度低下,同时也导致了在进行数据协调处理需要时占用大量的
资源,进一步增加了系统运行成本。
发明内容
接,并构成数据处理服务器集群,同时为中继服务器分配至少一个Master节点,同时为中继
服务器分配至少一个slave节点,并使中继服务器通过智能网关与外部网络系统建立数据
连接;
度管理器模块、节点管理器模块、Yarn服务代理服务器、资源使用分析模块和虚拟化服务
器,同时在Master节点处安装Flannel网络服务插件和Kubernetes网络服务管理插件,最后
在Master节点设置数据库系统、镜像仓库服务系统及管理门户系统,并使各数据存储空间、
资源调度管理器模块、节点管理器模块、Yarn服务代理服务器、资源使用分析模块和虚拟化
服务器、Flannel网络服务插件、Kubernetes网络服务管理插件、数据库系统、镜像仓库服务
系统及管理门户系统分别与基于卷积神经网络的操控平台建立数据连接;
prometheus监控报警系统、基于zookeeper的分布式应用程序协调系统及hadoop底层操控
系统均与基于卷积神经网络的操控平台建立数据连接;然后在中继服务器中搭建hadoop集
群,并在hadoop集群中根据任务特点构建若干yarn队列、同时为各yarn队列设置相应的配
置参数及控制yarn队列刷新控制文件;最后在中继服务器中部署前后台tomcat服务器,即
可完成系统配置;
数据进行运行展示,并对接受的数据特点、数据所占用资源量进行评估,并根据数据特点及
各类数据类别设定相应的yarn队列,然后通过hadoop集群对数据进行解析处理,并在解析
处理过程中为yarn队列分别分配独立的运行资源,并最终通过前后台tomcat服务器对处理
结果输出,同时将处理结果保存在数据处理服务器集群中相应的数据处理服务器中。
相应特点数据处理策略,并将数据处理策略保存在数据处理服务器中,同时将数据处理策
略在中继服务器的hadoop集群中生成同步映像文件,并与各yarn队列对应匹配,并在后续
同类特征数据处理时,直接通过数据处理策略自主调用相应资源即可实现自主数据处理和
简化数据处理时硬件资源占用量。
于LSTM的智能预测系统的深度学习神经网络系统。
和占独立数据存储空间中资源量80%—100%。
zookeeper的分布式应用程序协调服务系统运行,由基于zookeeper的分布式应用程序协调
服务系统根据接收数据特点对数据进行识别调度作业,然后基于yarn队列分别对特定类别
数据进行处理,并在处理过程中通过基于prometheus监控报警系统对数据处理过程进行监
控。
子系统、Yarn服务代理服务器子系统、资源使用分析子系统、虚拟化服务器子系统、基于
prometheus监控报警系统、基于zookeeper的分布式应用程序协调服务系统及hadoop集群
子系统,其中所述前后台tomcat服务器主系统、hadoop底层操控系统相互连接,且前后台
tomcat服务器主系统、hadoop底层操控系统通过基于prometheus监控报警系统、基于
zookeeper的分布式应用程序协调服务系统与hadoop集群子系统建立数据连接,所述资源
调度管理器子系统、节点管理器模块子系统、Yarn服务代理服务器子系统、资源使用分析子
系统、虚拟化服务器子系统均嵌于hadoop集群子系统中。
合利用率高,在确保系统运行稳定性的同时有效降低了数据处理系统运行成本;另一方面
可在有效提高数据处理作业效率的同时,有效的简化了数据及网络通讯系统的结构,降低
了数据处理对硬件资源的损耗,从而有效的降低数据处理作业时硬件设备投入及加工作业
的成本。
附图说明
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。
具体实施方式
领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明
保护的范围。
接,并构成数据处理服务器集群,同时为中继服务器分配至少一个Master节点,同时为中继
服务器分配至少一个slave节点,并使中继服务器通过智能网关与外部网络系统建立数据
连接;
度管理器模块、节点管理器模块、Yarn服务代理服务器、资源使用分析模块和虚拟化服务
器,同时在Master节点处安装Flannel网络服务插件和Kubernetes网络服务管理插件,最后
在Master节点设置数据库系统、镜像仓库服务系统及管理门户系统,并使各数据存储空间、
资源调度管理器模块、节点管理器模块、Yarn服务代理服务器、资源使用分析模块和虚拟化
服务器、Flannel网络服务插件、Kubernetes网络服务管理插件、数据库系统、镜像仓库服务
系统及管理门户系统分别与基于卷积神经网络的操控平台建立数据连接;
prometheus监控报警系统、基于zookeeper的分布式应用程序协调系统及Hadoop底层操控
系统均与基于卷积神经网络的操控平台建立数据连接;然后在中继服务器中搭建hadoop集
群,并在hadoop集群中根据任务特点构建若干yarn队列、同时为各yarn队列设置相应的配
置参数及控制yarn队列刷新控制文件;最后在中继服务器中部署前后台tomcat服务器,即
可完成系统配置;
数据进行运行展示,并对接受的数据特点、数据所占用资源量进行评估,并根据数据特点及
各类数据类别设定相应的yarn队列,然后通过hadoop集群对数据进行解析处理,并在解析
处理过程中为yarn队列分别分配独立的运行资源,并最终通过前后台tomcat服务器对处理
结果输出,同时将处理结果保存在数据处理服务器集群中相应的数据处理服务器中。
相应特点数据处理策略,并将数据处理策略保存在数据处理服务器中,同时将数据处理策
略在中继服务器的hadoop集群中生成同步映像文件,并与各yarn队列对应匹配,并在后续
同类特征数据处理时,直接通过数据处理策略自主调用相应资源即可实现自主数据处理和
简化数据处理时硬件资源占用量。
台另设基于LSTM的智能预测系统的深度学习神经网络系统。
独立数据存储空间中资源量80%—100%。
于zookeeper的分布式应用程序协调服务系统运行,由基于zookeeper的分布式应用程序协
调服务系统根据接收数据特点对数据进行识别调度作业,然后基于yarn队列分别对特定类
别数据进行处理,并在处理过程中通过基于prometheus监控报警系统对数据处理过程进行
监控。
子系统、Yarn服务代理服务器子系统、资源使用分析子系统、虚拟化服务器子系统、基于
prometheus监控报警系统、基于zookeeper的分布式应用程序协调服务系统及hadoop集群
子系统,其中所述前后台tomcat服务器主系统、Hadoop底层操控系统相互连接,且前后台
tomcat服务器主系统、Hadoop底层操控系统通过基于prometheus监控报警系统、基于
zookeeper的分布式应用程序协调服务系统与hadoop集群子系统建立数据连接,所述资源
调度管理器子系统、节点管理器模块子系统、Yarn服务代理服务器子系统、资源使用分析子
系统、虚拟化服务器子系统均嵌于hadoop集群子系统中。
合利用率高,在确保系统运行稳定性的同时有效降低了数据处理系统运行成本;另一方面
可在有效提高数据处理作业效率的同时,有效的简化了数据及网络通讯系统的结构,降低
了数据处理对硬件资源的损耗,从而有效的降低数据处理作业时硬件设备投入及加工作业
的成本。
盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。