会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 遗传优势 / 一种基于遗传算法的数据中心选址方法、系统及终端机

一种基于遗传算法的数据中心选址方法、系统及终端机

申请号 CN202211202617.2 申请日 2022-09-29 公开(公告)号 CN115564224A 公开(公告)日 2023-01-03
申请人 恒丰银行股份有限公司; 发明人 李则江; 李健健; 段晨光;
摘要 本发明提供一种基于遗传算法的数据中心选址方法、系统及终端机,涉及数据中心选址技术领域,根据选址需求设置城市因素,对每个城市打分;确定遗传编码;通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;通过对适度值进行汇总分析,得到总和值和平均值的偏移量;确定复制及交叉城市,进行交叉遗传,获取遗传编码,并对新一代偏移量排序;找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;为最终确定的优势城市。解决了通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择的问题。
权利要求

1.一种基于遗传算法的数据中心选址方法,其特征在于,方法包括:步骤一、根据选址需求设置城市因素,对每个城市打分;

步骤二、确定遗传编码;

步骤三、通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;

步骤四、通过对适度值进行汇总分析,得到总和值和平均值的偏移量;

步骤五、确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和四,获取新一代偏移量,并对新一代偏移量排序;

步骤六、找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;

步骤七、使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。

2.根据权利要求1所述的基于遗传算法的数据中心选址方法,其特征在于,步骤一还包括:采用二重结构编码对城市因素进行打分处理。

3.根据权利要求1所述的基于遗传算法的数据中心选址方法,其特征在于,步骤一中选址需求包括:合规性、安全性、前瞻性、适用性、经济性五个因素。

4.根据权利要求3所述的基于遗传算法的数据中心选址方法,其特征在于,a)合规性包括:满足标准和规范中关于生产与数据中心距离的要求,得分由距离依次增加;

b)安全性包括:根据数据中心选址标准规范,地震、台风、社会安全事件;

c)前瞻性包括:区域内高校、就业环境、科技人才因素;

d)适用性包括:综合考虑交通、人员集结便利性进行计算;

e)经济性包括:机房及配套费用。

5.根据权利要求1所述的基于遗传算法的数据中心选址方法,其特征在于,步骤二中将数据读入到计算机内存中,并将具体城市打分进行遗传编码转换,转换成遗传编码。

6.根据权利要求1所述的基于遗传算法的数据中心选址方法,其特征在于,步骤三中通过公式: 对每个城市因素得分进行适值计算。

7.根据权利要求1所述的基于遗传算法的数据中心选址方法,其特征在于,步骤四中通过公式:f(x)/∑f(x)及f(x)/avg(f)对适度值进行汇总分析。

8.一种基于遗传算法的数据中心选址系统,其特征在于,系统采用如权利要求1至7任意一项所述的基于遗传算法的数据中心选址方法,系统包括:选址打分模块、编码模块、适度值计算模块、汇总分析模块、交叉遗传模块、回溯模块以及迭代执行模块;

选址打分模块用于根据选址需求设置城市因素,对每个城市打分;

编码模块用于确定遗传编码;

适度值计算模块用于通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;

汇总分析模块用于通过对适度值进行汇总分析,得到总和值和平均值的偏移量;

交叉遗传模块用于确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和步骤四,获取新一代偏移量,并对新一代偏移量排序;

回溯模块用于找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;

迭代执行模块用于使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。

9.一种终端机,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于遗传算法的数据中心选址方法的步骤。

说明书全文

一种基于遗传算法的数据中心选址方法、系统及终端机

技术领域

[0001] 本发明涉及数据中心选址技术领域,尤其涉及一种基于遗传算法的数据中心选址方法、系统及终端机。

背景技术

[0002] 数据中心建设城市选址,就是确定在何处建中心、集群或云服务设施。它不仅关系到设施建设的投资和建设速度,而且在很大程度上决定了所提供的产品和服务的成本,从而影响银行的生产管理活动和经济效益。绝大多数银行在选址时都将面临着合规、安全、适用、经济等多种因素最优选择的决策。
[0003] 在传统城市选址过程中,往往统计出城市各种因素后,通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择。

发明内容

[0004] 本发明提供一种基于遗传算法的数据中心选址方法,方法解决了通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择的问题。
[0005] 基于遗传算法的数据中心选址方法包括:
[0006] 步骤一、根据选址需求设置城市因素,对每个城市打分;
[0007] 步骤二、确定遗传编码;
[0008] 步骤三、通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;
[0009] 步骤四、通过对适度值进行汇总分析,得到总和值和平均值的偏移量;
[0010] 步骤五、确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和四,获取新一代偏移量,并对新一代偏移量排序;
[0011] 步骤六、找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;
[0012] 步骤七、使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。
[0013] 进一步需要说明的是,步骤一还包括:采用二重结构编码对城市因素进行打分处理。
[0014] 进一步需要说明的是,步骤一中选址需求包括:合规性、安全性、前瞻性、适用性、经济性五个因素。
[0015] 进一步需要说明的是,a)合规性包括:满足标准和规范中关于生产与数据中心距离的要求,得分由距离依次增加;
[0016] b)安全性包括:根据数据中心选址标准规范,地震、台风、社会安全事件;
[0017] c)前瞻性包括:区域内高校、就业环境、科技人才因素;
[0018] d)适用性包括:综合考虑交通、人员集结便利性进行计算;
[0019] e)经济性包括:机房及配套费用。
[0020] 进一步需要说明的是,步骤二中将数据读入到计算机内存中,并将具体城市打分进行遗传编码转换,转换成遗传编码。
[0021] 进一步需要说明的是,步骤三中通过公式: 对每个城市因素得分进行适值计算。
[0022] 进一步需要说明的是,步骤四中通过公式:f(x)/∑f(x)及f(x)/avg(f)对适度值进行汇总分析。
[0023] 本发明还提供一种基于遗传算法的数据中心选址系统,系统包括:选址打分模块、编码模块、适度值计算模块、汇总分析模块、交叉遗传模块、回溯模块以及迭代执行模块;
[0024] 选址打分模块用于根据选址需求设置城市因素,对每个城市打分;
[0025] 编码模块用于确定遗传编码;
[0026] 适度值计算模块用于通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;
[0027] 汇总分析模块用于通过对适度值进行汇总分析,得到总和值和平均值的偏移量;
[0028] 交叉遗传模块用于确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和步骤四,获取新一代偏移量,并对新一代偏移量排序;
[0029] 回溯模块用于找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;
[0030] 迭代执行模块用于使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。
[0031] 本发明还提供一种终端机,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,处理器执行所述程序时实现基于遗传算法的数据中心选址方法的步骤。
[0032] 从以上技术方案可以看出,本发明具有以下优点:
[0033] 本发明提供的基于遗传算法的数据中心选址系统及方法解决了通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择的问题。
[0034] 本发明通过使用遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。算法的整个运算过程就是从任一初始的群体出发,通过随机选择、交叉和变异等遗传算子,使群体一代一代地进行到空间中最好的区域,直至达到最优点。通过机器学习编写遗传算法,对各备选城市数据进行遗传迭代择优,自动选择最优城市,为决策提供一定的科学分析依据。

附图说明

[0035] 为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036] 图1为基于遗传算法的数据中心选址方法流程图;
[0037] 图2为基于遗传算法的数据中心选址系统示意图。

具体实施方式

[0038] 如图1所示,本发明提供一种基于遗传算法的数据中心选址方法中所提供的图示仅以示意方式说明本发明的基本构想图。本发明提供的基于遗传算法的数据中心选址方法可以基于人工智能技术对关联的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0039] 本发明提供的数据中心选址方法还结合机器学习(Machine Learning,ML)进行选址分析,实现基于计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。
[0040] 如图1示出了本发明的基于遗传算法的数据中心选址方法的较佳实施例的流程图。基于遗传算法的数据中心选址方法应用于一个或者多个终端机中,所述终端机是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
[0041] 终端机可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、交互式网络电视(Internet Protocol Television,IPTV)等。终端机所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
[0042] 下面将结合附图来详细阐述本发明的基于遗传算法的数据中心选址方法,基于遗传算法的数据中心选址方法例如可应用于数据中心选址分析,解决拍脑袋问题:在传统城市选址过程中,往往统计出城市各种因素后,通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择,对于数据中心选址有积极作用。
[0043] 请参阅图1所示是一具体实施例中基于遗传算法的数据中心选址方法的流程图,方法包括:
[0044] S101、根据选址需求设置城市因素,对每个城市打分;
[0045] 具体来讲,分析选址需求,明确设置城市因素。本发明的设置城市因素包括:合规性、安全性、前瞻性、适用性、经济性五大因素为选择城市因素,按照以下规则,对备选城市进行打分,总分值为1‑5:
[0046] a)合规性:满足标准和规范中关于生产与数据中心距离的要求,所在国家级互联网骨干关键节点,得分由距离依次增加。
[0047] b)安全性:根据数据中心选址标准规范,地震、台风、社会安全事件等,影响越大,得分越低。
[0048] c)前瞻性:考虑区域内高校、就业环境、科技人才等因素,影响越大得分越高。
[0049] d)适用性:综合考虑交通、人员集结便利性等进行计算。
[0050] e)经济性:机房及配套费用,越高得分越低。
[0051] 示例性的讲,
[0052] 最终得分如表1所示
[0053] 表1:城市打分:
[0054]城市 A B C D E F G H I J K L M N O P Q
合规性 5 4 4 4 4 4 4 4 4 4 4 4 3 4 3 3 3
安全性 4 4 4 4 4 4 4 3 3 4 4 3 3 4 4 4 3
前瞻性 5 4 3 2 4 4 5 4 4 4 4 4 4 4 4 4 4
适用性 4 4 4 4 2 4 2 2 3 4 2 3 4 2 2 2 2
经济性 3 3 3 2 4 3 4 3 3 3 4 3 3 4 4 4 4
[0055] S102、确定遗传编码;
[0056] 通过计算机语言,将数据读入到计算机内存中,并将具体城市打分进行遗传编码转换,如表2中遗传编码列为转换后结果。
[0057] 表2:表格模拟运算数据
[0058] 城市编号 城市元素 遗传编码 适应度f(x) f(x)/∑f(x) f(x)/avg(f) MpA 21 10101 46 0.28 1.10 1B 19 10011 42 0.25 1.01 2
C 18 10010 41 0.25 0.98 3
D 14 1110 38 0.23 0.91 4
总计∑f(x)     167      
平均值avg(f)    41.75      
[0059] 解析:MP排序后,城市A为优良个体,可以进行复制遗传,城市D为不良个体抛弃。城市B和C进行交叉遗传。
[0060] S103、通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;
[0061] 通过公式: 对每个城市因素得分进行适值计算,可以得出表2中适应度列数据。
[0062] S104、通过对适度值进行汇总分析,得到总和值和平均值的偏移量;
[0063] 通过公式:f(x)/∑f(x)及f(x)/avg(f)对适度值进行汇总分析,获得关于总和和平均值的偏移量。
[0064] S105、确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和四,获取新一代偏移量,并对新一代偏移量排序;
[0065] S106、找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;
[0066] S107、使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。
[0067] 这样,方法解决了通过简单加法汇总排序,然后拍脑袋选择,存在一定的主观因素,无法真正挖掘城市优点,造成错误选择的问题。
[0068] 而且本发明通过使用遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。算法的整个运算过程就是从任一初始的群体出发,通过随机选择、交叉和变异等遗传算子,使群体一代一代地进行到空间中最好的区域,直至达到最优点。通过机器学习编写遗传算法,对各备选城市数据进行遗传迭代择优,自动选择最优城市,为决策提供一定的科学分析依据。
[0069] 以下是本公开实施例提供的基于遗传算法的数据中心选址系统的实施例,数据中心选址系统与上述各实施例的遗传算法的数据中心选址方法属于同一个发明构思,在基于遗传算法的数据中心选址系统的实施例中未详尽描述的细节内容,可以参考上述遗传算法的数据中心选址方法的实施例。
[0070] 如图2所示,本发明提供的基于遗传算法的数据中心选址系统包括:选址打分模块、编码模块、适度值计算模块、汇总分析模块、交叉遗传模块、回溯模块以及迭代执行模块;
[0071] 选址打分模块用于根据选址需求设置城市因素,对每个城市打分;
[0072] 编码模块用于确定遗传编码;
[0073] 适度值计算模块用于通过预设算法对每个城市选址因素得分进行适度值计算,得出适应度列数据;
[0074] 汇总分析模块用于通过对适度值进行汇总分析,得到总和值和平均值的偏移量;
[0075] 交叉遗传模块用于确定复制及交叉城市,进行交叉遗传,获取遗传编码,对新获取的子遗传编码重复执行步骤三和步骤四,获取新一代偏移量,并对新一代偏移量排序;
[0076] 回溯模块用于找出新一代偏移量排序中的优势代进行回溯,确定父一代,如此确定父一代为优势城市,代表各项因素综合优势最大;
[0077] 迭代执行模块用于使用计算机进行全交叉遍历,对所有备选城市进行轮回复制遗传及交叉遗传,综合最后所得代,为最终确定的优势城市。
[0078] 本发明提供的基于遗传算法的数据中心选址系统中,先确定遗传编码:采用二重结构编码对城市因素打分进行处理,避免无效染色体的产生,提高遗传算法的搜索效率。
[0079] 再基于适值计算:以城市因素每个打分的适应度函数值为依据进行搜索。适应度函数的确定常常运用两种方法:一是将目标函数直接作为适应度函数;二十将待求解的的目标函数做适当处理后再转化为适应度函数。本次地址选择中,设置适度函数为因素权重乘以因素得分即:
[0080] 确定遗传算子:遗传算子共有三个:复制、交叉、变异。本地址选择中,使用复制和交叉算子,复制是从一个旧种群中选择生命力强的个体位串产生新种群的过程。具有高适应度的位串更有可能在下一代中产生一个或多个子孙。交叉是指在匹配池中任选两个染色体,随机选择一个交换点位置,交换双亲染色体交换点部分,即可得到两个新染色体。
[0081] 本发明通过对每一个城市的因素数据通过适度函数计算分析,并进行下沉对比,在逐级迭代中使得最优解即最优城市逐级下沉,最终最底端城市即为科学分析的最终结果。
[0082] 本发明提供的基于遗传算法的数据中心选址系统中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0083] 本发明提供的基于遗传算法的数据中心选址系统及方法附图中的流程图和框图,图示了按照本公开各种实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。示例性的讲,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0084] 本发明提供的基于遗传算法的数据中心选址系统及方法中,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或电力服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(示例性的讲利用因特网服务提供商来通过因特网连接)。
[0085] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。