移动边缘环境下的Web服务QoS监控方法转让专利

申请号 : CN201910593640.0

文献号 : CN110417867B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张鹏程张雅玲金慧颖吉顺慧吉泓远

申请人 : 河海大学

摘要 :

本发明公开了一种移动边缘环境下的Web服务QoS监控方法。该方法通过收集用户和服务信息及Web服务的QoS属性数据,对其进行数据预处理后得到符合边缘环境特性的数据集,并采用高斯隐藏贝叶斯概率监控方法实现边缘环境下的QoS监控。在进行数据预处理时,去掉具有缺失数据的样本后,以服务的地理位置进行聚类划分,得到边缘服务器的位置信息和QoS数据样本流。通过学习部分样本,为每个边缘服务器计算先验概率,同时计算父属性的值来削弱属性间取值的依赖性,构造高斯隐藏贝叶斯分类器,从而提高监控结果的准确性。在监控过程中,考虑用户的移动性调用对应的分类器并结合KNN算法,最终得到监控结果。

权利要求 :

1.一种移动边缘环境下的Web服务QoS监控方法,其特征在于,包括如下步骤:(1)收集用户和服务信息及用户调用Web服务的QoS属性数据;

(2)对服务信息中的地理位置进行预处理构建边缘端环境,并筛选得到边缘服务器的样本数据流;

(3)基于高斯隐藏贝叶斯概率监控方法计算每个边缘服务器的先验概率,构造分类器;

包括如下步骤:

(31)根据QoS标准定义QoS属性标准的两类C={c0,c1},满足属性标准为c0类,不满足则为c1类;

(32)对于每个边缘服务器中的训练样本X={x1,x2,x3,…xn}是一组QoS属性值,n表示训练样本的个数,假设样本服从正态分布,在每个样本点用概率密度积分对QoS概率标准进行检验,具体公式如下:QoS_Value为QoS属性阈值,u为样本X的均值,σ2为样本X的方差,若P大于概率标准,当前样本属于c0类,反之当前样本属于c1类;

(33)取样本的最大似然估计值作为P(cj)的估计值,j=0或1;

(34)对于每个样本xi,其父属性的取值为xi~xi-1的均值,用π(xi)表示xi的隐藏父属性,计算先验概率分布函数P(X|cj);具体公式如下:其中, 表示类cj

约束下的高斯分布, 和 是类别cj中样本属性xi的均值和方差, 和 是xi的父属性的均值和方差, 是xi和π(xi)之间的相关系数;

(35)为每个边缘服务器构造对应的高斯隐藏贝叶斯分类器(4)根据用户位置调用贝叶斯分类器,实现边缘环境下的QoS监控。

2.根据权利要求1所述的移动边缘环境 下的Web服务QoS监控方法,其特征在于,所述步骤(1)中收集数据包括两个方面:从wsdream中收集包含经度、纬度的地理位置的服务信息;采用用户调用的Web服务的QoS属性值作为原始数据集。

3.根据权利要求1所述的移动边缘环境下的Web服务QoS监控方法,其特征在于,所述步骤(2)包括如下步骤:(21)根据服务的经、纬度值将服务划分于不同区域点中;

(22)将经度、纬度值相同的服务看作位于一个边缘服务器中,选取包含服务量不少于指定阈值的区域点作为边缘位置点,相应的服务器为边缘服务器;

(23)将用户调用同一边缘服务器中的服务的QoS属性值作为这个边缘服务器的样本数据流;

(24)去除样本数据流中QoS响应时间属性值为-1的样本。

4.根据权利要求1所述的移动边缘环境下的Web服务QoS监控方法,其特征在于,所述步骤(4)包括如下步骤:(41)用户通过边缘服务器wi调用服务,调用wi的高斯隐藏贝叶斯分类器,计算c0类的后验概率after_p(c0)和c1类的后验概率after_p(c1),得到两类的比值(42)用户移动到新的边缘服务器wj中,且wj中存在历史数据构造的分类器,调用wj的分类器得到后验概率比值;

(43)用户移动到一个没有历史数据的边缘服务器wl中,结合KNN算法,选取周边k个最近的边缘服务器,分别调用它们的分类器得到k个后验概率比值,根据位置进行加权作为此边缘服务器的后验概率比值;

(44)根据后验概率比值得到监控结果:若r>1则判断样本满足QoS属性,为c0类;若r<1则判断样本不满足QoS属性,为c1类;若r=1则认为无法判断。

说明书 :

移动边缘环境下的Web服务QoS监控方法

技术领域

[0001] 本发明涉及一种Web服务QoS监控方法,尤其涉及移动边缘环境下的Web服务QoS监控方法,属于互联网技术领域。

背景技术

[0002] 随着云计算、大数据等新技术对传统Web服务的推动,企业之间甚至个人对服务的需求正逐步转变为服务间的交互。服务质量(QoS)是Web服务的一组非功能属性的集合,是衡量第三方服务好坏的重要指标,每个QoS属性表示Web服务某一方面的质量信息,如响应时间,吞吐量,可靠性等。在复杂多变的环境中,Web服务的运行环境及其运行质量也无时无刻不发生着改变,为了让服务能够适应实时变化的环境,如何对Web服务质量(QoS)进行准确而灵敏的监控成为亟待解决的重点。此外,如今移动边缘计算是一项新兴技术,又由于其具有响应时间短、处理速度快的特点,因此,在服务推荐系统中,通过部署边缘服务器来为移动设备或移动用户提供可靠性服务成为当下在新环境中监控服务质量的新话题,服务质量(QoS)成为关键因素。
[0003] 现有的监控方法主要针对一般环境下的Web服务,主要采用的是概率监控方法。大多数的QoS属性标准可以用概率质量属性的方式来表达,如响应时间可描述为“某服务对客户请求的响应时间小于10s的概率为50%”。现有的概率监控方法主要有基于估值计算的监控方法,基于经典假设检验SPRT的监控方法和基于贝叶斯思想的监控方法。其中,基于贝叶斯思想的监控方法主要通过历史数据样本流构造贝叶斯分类器,从而计算后验概率得到监控结果,如Zhuang等考虑环境因素的影响,利用TF-IDF算法对构造的贝叶斯分类器进行加权处理进行监控;Zhang等结合信息增益和滑动窗口机制有效摒弃历史数据的过期信息,从而更加准确的监控Web服务QoS。但现有方法面对移动边缘环境下时效性短、变化快的数据,由于用户的移动性可能造成的监控结果偏差,且监控过程中忽略了属性间取值的依赖性。

发明内容

[0004] 发明目的:本发明的目的在于考虑属性间取值的依赖性和移动边缘环境下数据时效性短、变化快的特性,提供一种移动边缘环境下的Web服务QoS监控方法。
[0005] 技术方案:为实现上述发明目的,本发明所采用的技术方案是:
[0006] 一种移动边缘环境下的Web服务QoS监控方法,包括如下步骤:
[0007] (1)收集用户和服务信息及用户调用Web服务的QoS属性数据;
[0008] (2)对服务信息中的地理位置进行预处理构建边缘端环境,并筛选得到边缘服务器的样本数据流;
[0009] (3)基于高斯隐藏贝叶斯概率监控方法计算每个边缘服务器的先验概率,构造分类器;
[0010] (4)根据用户位置调用贝叶斯分类器,实现边缘环境下的QoS监控。
[0011] 作为优选,所述步骤(1)中收集数据主要包括两个方面:从wsdream中收集包含经度、纬度的地理位置的服务信息;采用用户调用的Web服务的QoS属性值作为原始数据集。
[0012] 作为优选,所述步骤(2)包括如下步骤:
[0013] (21)根据服务的经、纬度值将服务划分于不同区域点中;
[0014] (22)将经度、纬度值相同的服务看作位于一个边缘服务器中,选取包含服务量不少于指定阈值的区域点作为边缘位置点,相应的服务器为边缘服务器;
[0015] (23)将用户调用同一边缘服务器中的服务的QoS属性值作为这个边缘服务器的样本数据流;
[0016] (24)去除样本数据流中QoS响应时间属性值为-1的样本。
[0017] 作为优选,所述步骤(3)包括如下步骤:
[0018] (31)根据QoS标准定义QoS属性标准的两类C={c0,c1},满足属性标准为c0类,不满足则为c1类;
[0019] (32)对于每个边缘服务器中的训练样本X={x1,x2,x3,…xn}是一组QoS属性值,n表示训练样本的个数,假设样本服从正态分布,在每个样本点用概率密度积分对QoS概率标准进行检验,具体公式如下:
[0020]
[0021] QoS_Value为QoS属性阈值,u为样本X的均值,σ2为样本X的方差,若P大于概率标准,当前样本属于c0类,反之当前样本属于c1类;
[0022] (33)取样本的最大似然估计值作为P(cj)的估计值,j=0或1;
[0023] (34)对于每个样本xi,其父属性的取值为xi~xi-1的均值,用π(xi)表示xi的隐藏父属性,计算先验概率分布函数P(X|cj);具体公式如下:
[0024]
[0025] 其中, 表示类cj约束下的高斯分布,uxi和 是类别cj中样本属性xi的均值和方差, 和 是xi的父属性的均值和方差, 是xi和π(xi)之间的相关系数;
[0026] (35)为每个边缘服务器构造对应的高斯隐藏贝叶斯分类器
[0027]
[0028] 作为优选,所述步骤(4)包括如下步骤:
[0029] (41)用户通过边缘服务器wi调用服务,调用wi的高斯隐藏贝叶斯分类器,计算c0类的后验概率after_p(c0)和c1类的后验概率after_p(c1),得到两类的比值[0030] (42)用户移动到新的边缘服务器wj中,且wj中存在历史数据构造的分类器,调用wj的分类器得到后验概率比值;
[0031] (43)用户移动到一个没有历史数据的边缘服务器wl中,结合KNN算法,选取周边k个最近的边缘服务器,分别调用它们的分类器得到k个后验概率比值,根据位置进行加权作为此边缘服务器的后验概率比值;
[0032] (44)根据后验概率比值得到监控结果:若r>1则判断样本满足QoS属性,为c0类;若r<1则判断样本不满足QoS属性,为c1类;若r=1则认为无法判断。
[0033] 有益效果:本发明提供的移动边缘环境下的Web服务QoS监控方法,首先按照一般数据集中的服务地理位置信息对样本数据流进行预处理,得到满足边缘端特性的数据,再为每个边缘服务器计算先验信息构造高斯隐藏贝叶斯分类器,读取样本数据流,实现移动边缘环境下的Web服务QoS监控。与现有技术相比,本发明提供的移动边缘环境下的Web服务QoS监控方法,解决了由于用户的移动性带来的监控结果偏差问题,同时考虑了样本属性间的依赖性,有效提高了移动边缘环境下Web服务QoS监控的效率和准确性。

附图说明

[0034] 图1为本发明实施例的总体流程图;
[0035] 图2为本发明实施例的详细流程图。

具体实施方式

[0036] 下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0037] 如图1所示,本发明实施例公开的一种移动边缘环境下的Web服务QoS监控方法,主要包括4个步骤:
[0038] 步骤1:收集用户和服务信息及用户调用Web服务的QoS属性数据;
[0039] 步骤2:对服务信息中的地理位置进行预处理构建边缘端环境,并筛选得到边缘服务器的样本数据流;
[0040] 步骤3:基于高斯隐藏贝叶斯概率监控方法计算每个边缘服务器的先验概率,构造分类器;
[0041] 步骤4:根据用户位置调用贝叶斯分类器,实现边缘环境下的QoS监控。
[0042] 上述步骤1中收集数据主要包括两个方面:(1)从wsdream中收集包含经度、纬度的地理位置的服务信息;wsdream作为用户信息及服务信息收集的渠道,可提供Web服务可靠性和质量评估。服务信息用来确定移动边缘环境下边缘服务器所在的位置及区域。选择一些数据量大的服务区域,以提高实验的充分性。(2)采用用户调用的Web服务的响应时间作为数据集。借助服务的地理位置信息,将划分区域后的服务与之被调用的属性值一一对应,并进行下述步骤的处理。QoS属性数据是得到满足边缘环境特性的数据集的来源。下面结合一具体应用例说明本发明实施例的详细实施步骤。
[0043] 如图2所示,移动边缘环境下的Web服务QoS监控方法,具体步骤如下:
[0044] 步骤101:收集用户和服务信息和一般环境下的QoS属性值,主要是响应时间这样的具有代表性的属性;
[0045] 步骤102:根据wsdream中dataset文件描述收集包含经度、纬度值等地理位置的服务信息;
[0046] 步骤103:根据获取到的服务的经、纬度信息,分析统计各个经纬度对应的服务;
[0047] 步骤104:选择包含服务数量多的位置点作为边缘服务器位置点;
[0048] 步骤105:借助服务地理位置信息,将每个服务与其所在服务器位置点对应;
[0049] 步骤106:获取服务器点对应的服务被用户所调用的属性值,对数据样本流进行处理。
[0050] 步骤107:根据服务的经、纬度值将其划分为若干个点。例如,经纬度值为(-10.0,-55.0)包含21个服务,经纬度值为(-22.05,-77.05)包含3个服务,经纬度值为(-27,133)包含28个服务,等等。
[0051] 步骤108:选取服务信息量较大的位置点作为边缘位置点,以确保监控结果的可信度。筛选出其中包含服务个数大于等于15个服务的位置点共60个,近似看作位于边缘端的60个边缘服务器。
[0052] 步骤109:记上述服务器集合W={w1,w2,w3,…w60},在监控时,可将用户调用同一服务器中的服务的属性值作为历史数据集。
[0053] 步骤110:去除原始数据集中响应时间属性值为-1的服务。属性值为-1s表示该用户未调用该服务,为了保证服务的高调用率,以及达到在边缘端监控速度快和准确性高的特性,去除用户未调用的服务集后,得到边缘服务器对应的样本数据流,提高监控效率,减小误差;
[0054] 步骤111:根据QoS标准(例如:QoS标准为服务响应时间小于0.3s的概率大于85%),定义QoS属性标准的两类C={c0,c1},满足属性标准为c0类,不满足则为c1类。
[0055] 步骤112:对于每个边缘服务器的样本数据流,将样本数据分为两个部分,早期部分数据用于训练,后面的数据用来监控。
[0056] 步骤113:对于每个边缘服务器中的训练样本X={x1,x2,x3,…xn},是一组QoS属性值,即响应时间值,假设样本服从正态分布,每加入一个样本都对QoS概率标准进行检验,即是否满足此时的概率属性要求。在正态分布假设下,概率标准检验可由概率密度积分实现,公式如下:
[0057]
[0058] QoS_Value为QoS属性阈值,u为样本X的均值,σ2为样本X的方差,若P大于概率标准,当前样本属于c0类,反之当前样本属于c1类。
[0059] 步骤114:从上述步骤中统计得出c0类和c1类的个数,P(cj)通常取样本的最大似然估计作为估计值, 表示QoS标准检验可靠度属于类cj的个数,n则表示样本集中的样本总数。
[0060] 步骤115:为了削弱属性间取值的依赖性,从而提高监控结果的准确性,我们为每个样本属性设置一个隐藏的父属性,其代表着来自其他属性对这个属性的影响。对于样本向量X={x1,x2,x3,…xn,}中的样本xi,其父属性的取值为xi~xi-1的均值。贝叶斯算法中通常假设样本间互相独立,则其先验条件概率 π(xi)为xi的隐藏父属性。在高斯分布假设下:
[0061]
[0062] 其中, 表示类cj约束下的高斯分布,uxi和 是类别cj中样本属性xi的均值和方差,uπ(xi)和 是xi的父属性的均值和方差, 是xi和π(xi)之间的相关系数。
[0063] 步骤116:根据贝叶斯公式 由于P(X)对于所有的分类相同,故最终简化出高斯隐藏贝叶斯分类模型为:
[0064] 对每个边缘服务器进行如上步骤的训练,得到对应的分类器。
[0065] 步骤117:假定用户通过边缘服务器wi调用服务,使用此边缘服务器的数据样本流中后面的数据调用wi的高斯隐藏贝叶斯分类器,计算c0类的后验概率after_p(c0)和c1类的后验概率after_p(c1),得到两类的比值
[0066] 步骤118:如果用户从边缘服务器wi移动到新的边缘服务器wj中,且wj中存在历史数据构造的分类器,调用wj的分类器,计算两类后验概率比值。
[0067] 步骤119:用户移动到一个没有历史数据的边缘服务器wl中,选取周边k个最近的边缘服务器W={w1,w2,...wk},这k个边缘服务器与wl的距离分别为D={d1,d2,...dk},分别调用它们的分类器得到k个后验概率比值P={p1,p2,...pk},根据位置进行加权,距离越近则权重越大,则此边缘服务器的后验概率比值为r= 其中x由公式求得。
[0068] 步骤120:根据后验概率比值得到监控结果:r>1:样本满足QoS属性为c0类,r<1:不满足QoS属性为c1类以及r=1:无法判断三种结果。