虚拟资源调度方法与装置转让专利

申请号 : CN201410058955.2

文献号 : CN104866382B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨迪王燕川任华王铮毕家瑜方燕萍

申请人 : 中国电信股份有限公司

摘要 :

本发明公开了虚拟资源调度装置与方法,该方法包括:采集业务层参数和网络层参数;根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。本发明可以保证业务开展所需的质量。

权利要求 :

1.虚拟资源调度方法,其特征在于:采集业务开展涉及的业务层参数和网络层参数;

根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;

将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对所述业务的资源的分配;

其中,业务层指标HN的计算公式为:HN=(Ts×Ps+Td×Pd)÷log2Ld其中,Ts为发出成功率权重,Td为递送成功率权重,Ps为发出成功率,Pd为递送成功率,Ld为递送时延率。

2.根据权利要求1所述虚拟资源调度方法,其特征在于:将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。

3.根据权利要求1所述虚拟资源调度方法,其特征在于:将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。

4.根据权利要求1或2或3所述虚拟资源调度方法,其特征在于:网络层指标H的计算公式为:H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+θNk×HNk)]×100其中:

§N是接口协议类型N的权重因子,取值范围是0~1;

θNk是接口协议类型N的接口k的权重因子,取值范围是0~1;

HNk是接口类型N的接口k的健康指标Hitf;

Rp表示接口请求响应率,根据请求数与响应数计算的比率;

Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;

Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;

Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。

5.根据权利要求4所述虚拟资源调度方法,其特征在于:接口请求成功率Rs:其中:

n为请求种类;

α为某类请求的权重因子;

m为失败原因种类;

β为权重因子;

CAU为某种原因的失败响应数;

SUC为成功响应数。

6.根据权利要求4所述虚拟资源调度方法,其特征在于:接口请求时延率Kd:其中:

n为请求种类;

α为某类请求的权重因子;

DLY为某类请求的平均响应时延,最小等于DLS;

DLS为某类请求的标准响应时延。

7.根据权利要求4所述虚拟资源调度方法,其特征在于:接口繁忙率Kb:

其中:

Umax为网元设计支持的最大用户数;

U为活动用户数、流量、承载数、消息或报文数。

8.根据权利要求4所述虚拟资源调度方法,其特征在于:接口请求响应率Rp:其中:

n为请求种类;

α为某类请求的权重因子;

RSP为发出的响应数;

RQT为收到的请求数。

9.根据权利要求1所述虚拟资源调度方法,其特征在于:发出成功率Ps:

其中:

m为业务错误的原因种类;

β为原因权重;

Cs为某种发送失败原因次数;

Ss为发送成功次数;

RQTs为业务请求的次数;

RSPs为业务响应的次数。

10.根据权利要求1所述虚拟资源调度方法,其特征在于:递送成功率Pd:

其中:

n为业务处理的原因种类;

α为原因权重;

Cd为通知递送失败的某原因次数;

Sd为通知递送成功的次数;

RQTs为业务请求的次数;

RQTd为业务响应的次数。

11.根据权利要求1所述虚拟资源调度方法,其特征在于:递送时延率Ld:

其中:

Davg为平均递送时延;

Dstd为标准递送时延。

12.虚拟资源调度装置,其特征在于:业务层采集接口,业务开展涉及的采集业务层参数;

网络层采集接口,采集网络层参数;

计算处理单元,根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对所述业务的资源的分配;

其中,业务层指标HN的计算公式为:HN=(Ts×Ps+Td×Pd)÷log2Ld其中,Ts为发出成功率权重,Td为递送成功率权重,Ps为发出成功率,Pd为递送成功率,Ld为递送时延率。

13.根据权利要求12所述虚拟资源调度装置,其特征在于:将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。

14.根据权利要求12所述虚拟资源调度装置,其特征在于:将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。

15.根据权利要求12或13或14所述虚拟资源调度装置,其特征在于:网络层指标H的计算公式为:H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+θNk×HNk)]×100其中:

§N是接口协议类型N的权重因子,取值范围是0~1;

θNk是接口协议类型N的接口k的权重因子,取值范围是0~1;

HNk是接口类型N的接口k的健康指标Hitf;

Rp表示接口请求响应率,根据请求数与响应数计算的比率;

Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;

Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;

Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。

16.根据权利要求15所述虚拟资源调度装置,其特征在于:接口请求成功率Rs:其中:

n为请求种类;

α为某类请求的权重因子;

m为失败原因种类;

β为权重因子;

CAU为某种原因的失败响应数;

SUC为成功响应数。

17.根据权利要求15所述虚拟资源调度装置,其特征在于:接口请求时延率Kd:其中:

n为请求种类;

α为某类请求的权重因子;

DLY为某类请求的平均响应时延,最小等于DLS;

DLS为某类请求的标准响应时延。

18.根据权利要求15所述虚拟资源调度装置,其特征在于:接口繁忙率Kb:

其中:

Umax为网元设计支持的最大用户数;

U为活动用户数、流量、承载数、消息或报文数。

19.根据权利要求15所述虚拟资源调度装置,其特征在于:接口请求响应率Rp:其中:

n为请求种类;

α为某类请求的权重因子;

RSP为发出的响应数;

RQT为收到的请求数。

20.根据权利要求12所述虚拟资源调度装置,其特征在于:发出成功率Ps:

其中:

m为业务错误的原因种类;

β为原因权重;

Cs为某种发送失败原因次数;

Ss为发送成功次数;

RQTs为业务请求的次数;

RSPs为业务响应的次数。

21.根据权利要求12所述虚拟资源调度装置,其特征在于:递送成功率Pd:

其中:

n为业务处理的原因种类;

α为原因权重;

Cd为通知递送失败的某原因次数;

Sd为通知递送成功的次数;

RQTs为业务请求的次数;

RQTd为业务响应的次数。

22.根据权利要求12所述虚拟资源调度装置,其特征在于:递送时延率Ld:

其中:

Davg为平均递送时延;

Dstd为标准递送时延。

说明书 :

虚拟资源调度方法与装置

技术领域

[0001] 本发明属于云计算领域,尤其涉及虚拟资源调度方法与装置。

背景技术

[0002] 按需使用资源是云计算的显著特点,主流的资源伸缩方案是监控应用所在虚拟机的CPU、内存等,在达到预设的阀值时进行资源调度。但是通过虚拟机的CPU、内存等指标并不一定能直接反映业务生产的实际情况,比如业务处理的时延及响应率都已经不符合业务开展要求时,可能此时CPU和内存的开销并不高。

发明内容

[0003] 本发明的发明人发现上述现有技术中存在问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。
[0004] 根据本发明一方面,提出虚拟资源调度方法,包括:
[0005] 采集业务层参数和网络层参数;
[0006] 根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;
[0007] 将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。
[0008] 进一步,将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。
[0009] 进一步,将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。
[0010] 进一步,网络层指标H的计算公式为:
[0011] H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+[0012] θNk×HNk)]×100
[0013] 其中:§N是接口协议类型N的权重因子,取值范围是0~1;θNk是接口协议类型N的接口k的权重因子,取值范围是0~1;HNk是接口类型N的接口k的健康指标Hitf;
[0014]
[0015] Rp表示接口请求响应率,根据请求数与响应数计算的比率;Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。
[0016] 进一步,接口请求成功率Rs:
[0017]
[0018] 其中:n为请求种类;α为某类请求的权重因子;m为失败原因种类;β为权重因子;CAU为某种原因的失败响应数;SUC为成功响应数。
[0019] 进一步,接口请求时延率Kd:
[0020]
[0021] 其中:n为请求种类;α为某类请求的权重因子;DLY为某类请求的平均响应时延,最小等于DLS;DLS为某类请求的标准响应时延。
[0022] 进一步,接口繁忙率Kb:
[0023]
[0024] 其中:Umax为网元设计支持的最大用户数;U为活动用户数、流量、承载数、消息或报文数。
[0025] 进一步,接口请求响应率Rp:
[0026]
[0027] 其中:n为请求种类;α为某类请求的权重因子;RSP为发出的响应数;RQT为收到的请求数。
[0028] 进一步,业务层指标HN的计算公式为:
[0029] HN=(Ts×Ps+Td×Pd)÷log2Ld
[0030] 其中:Ts为发出成功率权重;Td为递送成功率权重;Ps为发出成功率;Pd为递送成功率;Ld为递送时延率。
[0031] 进一步,发出成功率Ps:
[0032]
[0033] 其中:m为业务错误的原因种类;β为原因权重;Cs为某种发送失败原因次数;Ss为发送成功次数;RQTs为业务请求的次数;RSPs为业务响应的次数。
[0034] 进一步,递送成功率Pd:
[0035]
[0036] 其中:n为业务处理的原因种类;α为原因权重;Cd为通知递送失败的某原因次数;Sd为通知递送成功的次数;RQTs为业务请求的次数;RQTd为业务响应的次数。
[0037] 进一步,递送时延率Ld:
[0038]
[0039] 其中:Davg为平均递送时延;Dstd为标准递送时延。
[0040] 根据本发明另一方面,提出虚拟资源调度装置,包括:
[0041] 业务层采集接口,采集业务层参数;
[0042] 网络层采集接口,采集网络层参数;
[0043] 计算处理单元,根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。
[0044] 进一步,将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。
[0045] 进一步,将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。
[0046] 进一步,网络层指标H的计算公式为:
[0047] H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+[0048] θNk×HNk)]×100
[0049] 其中:§N是接口协议类型N的权重因子,取值范围是0~1;θNk是接口协议类型N的接口k的权重因子,取值范围是0~1;HNk是接口类型N的接口k的健康指标Hitf;
[0050]
[0051] Rp表示接口请求响应率,根据请求数与响应数计算的比率;Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。
[0052] 进一步,接口请求成功率Rs:
[0053]
[0054] 其中:n为请求种类;α为某类请求的权重因子;m为失败原因种类;β为权重因子;CAU为某种原因的失败响应数;SUC为成功响应数。
[0055] 进一步,接口请求时延率Kd:
[0056]
[0057] 其中:n为请求种类;α为某类请求的权重因子;DLY为某类请求的平均响应时延,最小等于DLS;DLS为某类请求的标准响应时延。
[0058] 进一步,接口繁忙率Kb:
[0059]
[0060] 其中:Umax为网元设计支持的最大用户数;U为活动用户数、流量、承载数、消息或报文数。
[0061] 进一步,接口请求响应率Rp:
[0062]
[0063] 其中:n为请求种类;α为某类请求的权重因子;RSP为发出的响应数;RQT为收到的请求数。
[0064] 进一步,业务层指标HN的计算公式为:
[0065] HN=(Ts×Ps+Td×Pd)÷log2Ld
[0066] 其中:Ts为发出成功率权重;Td为递送成功率权重;Ps为发出成功率;Pd为递送成功率;Ld为递送时延率。
[0067] 进一步,发出成功率Ps:
[0068]
[0069] 其中:m为业务错误的原因种类;β为原因权重;Cs为某种发送失败原因次数;Ss为发送成功次数;RQTs为业务请求的次数;RSPs为业务响应的次数。
[0070] 递送成功率Pd:
[0071]
[0072] 其中:n为业务处理的原因种类;α为原因权重;Cd为通知递送失败的某原因次数;Sd为通知递送成功的次数;RQTs为业务请求的次数;RQTd为业务响应的次数。
[0073] 进一步,递送时延率Ld:
[0074]
[0075] 其中:Davg为平均递送时延;Dstd为标准递送时延。
[0076] 本发明可以保证业务开展所需的质量。
[0077] 通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

[0078] 构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
[0079] 参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
[0080] 图1所示为本发明实施例中的虚拟资源调度方法的流程示意图。
[0081] 图2所示为本发明实施例中的虚拟资源调度装置的结构示意图。

具体实施方式

[0082] 现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0083] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0084] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
[0085] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
[0086] 在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0087] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0088] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0089] 图1所示为本发明实施例中的虚拟资源调度方法的流程示意图。
[0090] 在步骤11,采集业务层参数和网络层参数。其中,业务层参数是涉及业务感知的相关参数,如业务递出成功率、业务递送时延等参数;网络层参数是业务涉及的相关网络指标参数,如接口协议占比、网络进出流量、接口请求成功率等参数。
[0091] 在步骤12,根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标。
[0092] 在步骤13,将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。
[0093] 其中,将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。这里所说的资源主要指业务资源。在该实施例中,还可以在业务层指标大于业务层上限阈值且持续设定时间,则减少对其分配的资源;当业务层指标小于业务层下限阈值且持续设定时间,则增加对其分配的资源,例如,扩充软件许可、扩充并发数。在持续设定时间触发请求,这样设置的好处就是防止个别时候的“毛刺”情况导致频繁请求和释放资源,而且考虑上下限设置时一般都考虑了余量因素,可以满足在一定时间后触发请求的要求。此外,当业务层指标大于业务层下限阈值且小于上限阈值时,即业务层指标在下限阈值与上限阈值之间时,可以不进行调整,也可以根据具体情况进行调整。上述实施例中提到的上限阈值以及下限阈值均可进行变更和更改。
[0094] 将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。这里所说的资源主要指网络资源。在该实施例中,还可以在网络层指标大于网络层上限阈值且持续设定时间,则减少对其分配的资源;当网络层指标小于网络层下限阈值且持续设定时间,则增加对其分配的资源。在持续设定时间触发请求,这样设置的好处就是防止个别时候的“毛刺”情况导致频繁请求和释放资源,而且考虑上下限设置时一般都考虑了余量因素,可以满足在一定时间后触发请求的要求。此外,当网络层指标大于网络层下限阈值且小于上限阈值时,即网络层指标在下限阈值与上限阈值之间时,可以不进行调整,也可以根据具体情况进行调整。上述实施例中提到的上限阈值以及下限阈值均可进行变更和更改。
[0095] 现有资源调度策略单一采用CPU、内存等硬件指标,无法准确评估业务开展所需实际资源。该实施例综合考虑业务开展涉及的业务层和网络层的处理能力等指标,新增对业务层和网络层处理能力的采集,计算出业务开展所需的资源量,并将计算结果用于资源弹性伸缩的判断与控制。例如,一个处理消息转换分发的系统,可能的情况是CPU、内存使用率都很低,但同时系统响应时延又特别高(一个业务请求可能需要花上6秒延迟,但是实际要求中能接受的延迟是100毫秒),在此情况下原有技术并不会认为业务开展有问题。而通过本发明的上述实施例,通过业务层指标或网络层指标发现存在的问题,如果是网络问题的话可以增加网络资源,如果是业务问题的话可以增加应用的并发授权数来提升业务处理速度,保证业务开展所需的质量。
[0096] 下面将结合实施例,对根据网络层参数计算网络层指标的过程进行详细说明。本领域技术人员应该可以理解,这里所说的实施例只是用于举例说明,不应理解为对本发明的限制。可以在该实施例的基础上,进行相应的修改和变型。
[0097] 定义网络层指标H,反映整个网元所需网络的健康度,根据网元对外网络交互的各个接口反映出来的处理能力、稳定性、繁忙度而计算得出。有几个接口几条链路,那么网络层指标H就需要计算多少项。
[0098] 网络层指标H的计算公式为:
[0099] H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+[0100] θNk×HNk)]×100
[0101] 其中:
[0102] §A是接口协议类型A的权重因子,§B是接口协议类型B的权重因子,§N是接口协议类型N的权重因子。权重因子的取值范围0~1,即,大于等于0小于等于1,在本发明其他实施例中的权重因子可以参考该实施例中的权重因子的取值。该类因子主要包含对接口重要性、接口容量的权衡。
[0103] θA1是接口协议类型A的接口1的权重因子,θBm是接口协议类型B的接口m的权重因子,θNk是接口协议类型N的接口k的权重因子。权重因子的取值范围0~1,即,大于等于0小于等于1,该类因子主要考虑用户数、消息量等。
[0104] HA1是接口协议类型A的接口1的健康指标,HBm是接口类型B的接口m的健康指标,HNk是接口类型N的接口k的健康指标。该指标的计算方法见接口健康指标Hitf。
[0105]
[0106] Rp表示接口请求响应率,根据请求数与响应数计算的比率;
[0107] Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;
[0108] Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;
[0109] Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。
[0110] 在该实施例中,Rp·Rs表示Rp×Rs,即,这里的点表示乘号。在本发明的其他实施例中,点也可以表示乘号。
[0111] 下面将分别对Rp、Rs、Kd以及Kb的计算过程进行举例说明。
[0112] 1)接口请求成功率Rs:
[0113]
[0114] 其中:
[0115] n为请求种类;
[0116] α为某类请求的权重因子;
[0117] m为失败原因种类;
[0118] β为权重因子,主要考虑各种原因与本网元的关系密切度;
[0119] CAU为某种原因的失败响应数;
[0120] SUC为成功响应数。
[0121] 2)接口请求时延率Kd:
[0122]
[0123] 其中:
[0124] n为请求种类;
[0125] α为某类请求的权重因子,包含对请求的优先级、影响度的权衡;
[0126] DLY为某类请求的平均响应时延,最小等于DLS,平均响应时延可以根据接收到请求与发出响应之间的时间差统计汇总计算平均值后获得;
[0127] DLS为某类请求的标准响应时延,可以由所涉及的接口设计要求中获得,也可由管理人员根据运营需要进行设置。
[0128] 3)接口繁忙率Kb:
[0129]
[0130] 其中:
[0131] Umax为网元设计支持的最大用户数;
[0132] U为活动用户数。根据不同网元,用户数可以改为流量、承载数、消息或报文数等。
[0133] 4)接口请求响应率Rp:
[0134]
[0135] 其中:
[0136] n为收到的请求种类;
[0137] α为某类请求的权重因子,主要考虑消息数占比;
[0138] RSP为发出的响应数;
[0139] RQT为收到的请求数。
[0140] 在一实施例中,根据上述各个参数计算网络层指标H,假设网络层指标H的上限阈值为85,下限阈值为60,则分别为:
[0141] 当H>85时,可向资源管理平台请求减少网络资源,还可以结合各分类指标决定减少网络资源的类型和数量;
[0142] 当H<60时,可向资源管理平台请求增加网络资源,还可以结合各分类指标决定增加资源的类型和数量。网络资源的类型包括增加带宽(上行带宽和下行带宽)、修改路由路径等。
[0143] 下面将结合实施例,对根据业务层参数计算业务层指标的过程进行详细说明。本领域技术人员应该可以理解,这里所说的实施例只是用于举例说明,不应理解为对本发明的限制。可以在该实施例的基础上,进行相应的修改和变型。
[0144] 业务层指标HN的计算公式为:
[0145] HN=(Ts×Ps+Td×Pd)÷log2Ld
[0146] 其中:
[0147] Ts为发出成功率权重;
[0148] Td为递送成功率权重;
[0149] Ps为发出成功率;
[0150] Pd为递送成功率;
[0151] Ld为递送时延率。
[0152] 下面将分别对Ps、Pd以及Lb的计算过程进行举例说明。
[0153] a)发出成功率Ps:
[0154]
[0155] 其中:
[0156] m为业务错误的原因种类;
[0157] β为原因权重;
[0158] Cs为某种发送失败原因次数;
[0159] Ss为发送成功次数;
[0160] RQTs为业务请求的次数;
[0161] RSPs为业务响应的次数。
[0162] b)递送成功率Pd:
[0163]
[0164] 其中:
[0165] n为业务处理的原因种类;
[0166] α为原因权重;
[0167] Cd为通知递送失败的某原因次数;
[0168] Sd为通知递送成功的次数;
[0169] RQTs为业务请求的次数;
[0170] RQTd为业务响应的次数。
[0171] c)递送时延率Ld:
[0172]
[0173] 其中:
[0174] Davg为平均递送时延。
[0175] Dstd为标准递送时延。
[0176] 在上述实施例中,对于计算网络层指标以及业务层指标的过程进行了举例说明。当然,不限于上述的各个实施例,可以据此进行相应的变型和修改。本发明的上述实施例,综合考虑业务开展涉及的业务层和网络层的处理能力等指标,计算出业务开展所需的资源量,并将计算结果用于资源弹性伸缩的判断与控制。本发明可以保证业务开展所需的质量。
[0177] 图2所示为本发明实施例中的虚拟资源调度装置的结构示意图。
[0178] 业务层采集接口,采集业务层参数。其中,业务层指标是涉及业务感知的相关参数,如业务递出成功率、业务递送时延等参数。
[0179] 网络层采集接口,采集网络层参数。其中,网络层指标是业务涉及的相关网络指标参数,如接口协议占比、网络进出流量、接口请求成功率等参数。
[0180] 计算处理单元,根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。
[0181] 其中,将业务层指标与业务层上限阈值和业务层下限阈值进行比较,当业务层指标大于业务层上限阈值,则减少对其分配的资源,当业务层指标小于业务层下限阈值,则增加对其分配的资源。这里所说的资源主要指业务资源。在该实施例中,还可以在业务层指标大于业务层上限阈值且持续设定时间,则减少对其分配的资源;当业务层指标小于业务层下限阈值且持续设定时间,则增加对其分配的资源,例如,扩充软件许可、扩充并发数。在持续设定时间触发请求,这样设置的好处就是防止个别时候的“毛刺”情况导致频繁请求和释放资源,而且考虑上下限设置时一般都考虑了余量因素,可以满足在一定时间后触发请求的要求。此外,当业务层指标大于业务层下限阈值且小于上限阈值时,即业务层指标在下限阈值与上限阈值之间时,可以不进行调整,也可以根据具体情况进行调整。上述实施例中提到的上限阈值以及下限阈值均可进行变更和更改。
[0182] 将网络层指标与网络层上限阈值和网络层下限阈值进行比较,当网络层指标大于网络层上限阈值,则减少对其分配的资源,当网络层指标小于网络层下限阈值,则增加对其分配的资源。这里所说的资源主要指网络资源。在该实施例中,还可以在网络层指标大于网络层上限阈值且持续设定时间,则减少对其分配的资源;当网络层指标小于网络层下限阈值且持续设定时间,则增加对其分配的资源。在持续设定时间触发请求,这样设置的好处就是防止个别时候的“毛刺”情况导致频繁请求和释放资源,而且考虑上下限设置时一般都考虑了余量因素,可以满足在一定时间后触发请求的要求。此外,当网络层指标大于网络层下限阈值且小于上限阈值时,即网络层指标在下限阈值与上限阈值之间时,可以不进行调整,也可以根据具体情况进行调整。上述实施例中提到的上限阈值以及下限阈值均可进行变更和更改。
[0183] 现有资源调度策略单一采用CPU、内存等硬件指标,无法准确评估业务开展所需实际资源。该实施例综合考虑业务开展涉及的业务层和网络层的处理能力等指标,新增对业务层和网络层处理能力的采集,计算出业务开展所需的资源量,并将计算结果用于资源弹性伸缩的判断与控制。例如,一个处理消息转换分发的系统,可能的情况是CPU、内存使用率都很低,但同时系统响应时延又特别高(一个业务请求可能需要花上6秒延迟,但是实际要求中能接受的延迟是100毫秒),在此情况下原有技术并不会认为业务开展有问题。而通过本发明的上述实施例,通过业务层指标或网络层指标发现存在的问题,如果是网络问题的话可以增加网络资源,如果是业务问题的话可以增加应用的并发授权数来提升业务处理速度,保证业务开展所需的质量。
[0184] 下面将结合实施例,对根据网络层参数计算网络层指标的过程进行详细说明。本领域技术人员应该可以理解,这里所说的实施例只是用于举例说明,不应理解为对本发明的限制。可以在该实施例的基础上,进行相应的修改和变型。
[0185] 定义网络层指标H,反映整个网元所需网络的健康度,根据网元对外网络交互的各个接口反映出来的处理能力、稳定性、繁忙度而计算得出。有几个接口几条链路,那么网络层指标H就需要计算多少项。
[0186] 网络层指标H的计算公式为:
[0187] H=[§A(θA1×HA1+...+θAn×HAn)+§B(θB1×HB1+...+θBm×HBm)+…§N(θN1×HN1+...+[0188] θNk×HNk)]×100
[0189] 其中:
[0190] §A是接口协议类型A的权重因子,§B是接口协议类型B的权重因子,§N是接口协议类型N的权重因子。权重因子的取值范围0~1,该类因子主要包含对接口重要性、接口容量的权衡。
[0191] θA1是接口协议类型A的接口1的权重因子,θBm是接口协议类型B的接口m的权重因子,θNk是接口协议类型N的接口k的权重因子。权重因子的取值范围0~1,该类因子主要考虑用户数、消息量等。
[0192] HA1是接口协议类型A的接口1的健康指标,HBm是接口类型B的接口m的健康指标,HNk是接口类型N的接口k的健康指标。该指标的计算方法见接口健康指标Hitf。
[0193]
[0194] Rp表示接口请求响应率,根据请求数与响应数计算的比率;
[0195] Rs表示接口请求成功率,根据成功响应数与失败响应数计算的比率;
[0196] Kd表示接口请求时延率,根据平均响应时延与标准响应时延计算的比率;
[0197] Kb表示接口繁忙率,根据并发用户数与最大支持用户数计算的比率。
[0198] 下面将分别对Rp、Rs、Kd以及Kb的计算过程进行举例说明。
[0199] 1)接口请求成功率Rs:
[0200]
[0201] 其中:
[0202] n为请求种类;
[0203] α为某类请求的权重因子;
[0204] m为失败原因种类;
[0205] β为权重因子,主要考虑各种原因与本网元的关系密切度;
[0206] CAU为某种原因的失败响应数;
[0207] SUC为成功响应数。
[0208] 2)接口请求时延率Kd:
[0209]
[0210] 其中:
[0211] n为请求种类;
[0212] α为某类请求的权重因子,包含对请求的优先级、影响度的权衡;
[0213] DLY为某类请求的平均响应时延,最小等于DLS,平均响应时延可以根据接收到请求与发出响应之间的时间差统计汇总计算平均值后获得;
[0214] DLS为某类请求的标准响应时延,可以由所涉及的接口设计要求中获得,也可由管理人员根据运营需要进行设置。
[0215] 3)接口繁忙率Kb:
[0216]
[0217] 其中:
[0218] Umax为网元设计支持的最大用户数;
[0219] U为活动用户数。根据不同网元,用户数可以改为流量、承载数、消息或报文数等。
[0220] 4)接口请求响应率Rp:
[0221]
[0222] 其中:
[0223] n为收到的请求种类;
[0224] α为某类请求的权重因子,主要考虑消息数占比;
[0225] RSP为发出的响应数;
[0226] RQT为收到的请求数。
[0227] 在一实施例中,根据上述各个参数计算网络层指标H,假设网络层指标H的上限阈值为85,下限阈值为60,则分别为:
[0228] 当H>85时,可向资源管理平台请求减少网络资源,还可以结合各分类指标决定减少网络资源的类型和数量;
[0229] 当H<60时,可向资源管理平台请求增加网络资源,还可以结合各分类指标决定增加资源的类型和数量。网络资源的类型包括增加带宽(上行带宽和下行带宽)、修改路由路径等。
[0230] 下面将结合实施例,对根据业务层参数计算业务层指标的过程进行详细说明。本领域技术人员应该可以理解,这里所说的实施例只是用于举例说明,不应理解为对本发明的限制。可以在该实施例的基础上,进行相应的修改和变型。
[0231] 业务层指标HN的计算公式为:
[0232] HN=(Ts×Ps+Td×Pd)÷log2Ld
[0233] 其中:
[0234] Ts为发出成功率权重;
[0235] Td为递送成功率权重;
[0236] Ps为发出成功率;
[0237] Pd为递送成功率;
[0238] Ld为递送时延率。
[0239] 下面将分别对Ps、Pd以及Lb的计算过程进行举例说明。
[0240] a)发出成功率Ps:
[0241]
[0242] 其中:
[0243] m为业务错误的原因种类;
[0244] β为原因权重;
[0245] Cs为某种发送失败原因次数;
[0246] Ss为发送成功次数;
[0247] RQTs为业务请求的次数;
[0248] RSPs为业务响应的次数。
[0249] b)递送成功率Pd:
[0250]
[0251] 其中:
[0252] n为业务处理的原因种类;
[0253] α为原因权重;
[0254] Cd为通知递送失败的某原因次数;
[0255] Sd为通知递送成功的次数;
[0256] RQTs为业务请求的次数;
[0257] RQTd为业务响应的次数。
[0258] c)递送时延率Ld:
[0259]
[0260] 其中:
[0261] Davg为平均递送时延。
[0262] Dstd为标准递送时延。
[0263] 在上述实施例中,对于计算网络层指标以及业务层指标的过程进行了举例说明。当然,不限于上述的各个实施例,可以据此进行相应的变型和修改。本发明的上述实施例,综合考虑业务开展涉及的业务层和网络层的处理能力等指标,计算出业务开展所需的资源量,并将计算结果用于资源弹性伸缩的判断与控制。本发明可以保证业务开展所需的质量。
[0264] 至此,已经详细描述了本发明。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
[0265] 可能以许多方式来实现本发明的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
[0266] 虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。