一种基于云计算的大数据信息分析方法及系统转让专利

申请号 : CN202210436836.0

文献号 : CN114528112B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 侯宝元

申请人 : 睿至科技集团有限公司

摘要 :

本申请涉及数据处理领域,尤其涉及一种基于云计算的大数据信息分析方法及系统,包括:云端接收终端发送的分析请求,并且在云端查找得到待分析数据;为查找到的待分析数据调用匹配的子功能程序;被调用的子功能程序对待分析数据进行处理;将多个子功能程序的处理结果进行融合,得到分析结果;云端将分析结果返回给终端,作为对分析请求的响应。本申请可以使云端能够满足对不同种类的数据的处理,同时还能够减少对运算的性能的影响。

权利要求 :

1.一种基于云计算的大数据信息分析方法,其特征在于,包括如下步骤:步骤S110、云端接收终端发送的分析请求,并且在云端查找得到待分析数据;

步骤S120、为查找到的待分析数据调用匹配的子功能程序;

步骤S130、被调用的子功能程序对待分析数据进行处理;

步骤S140、将多个子功能程序的处理结果进行融合,得到分析结果;

通过公式 ,对多个子功能程序的

处理结果进行融合,得到分析结果;

其中, 为分析结果, 为第 个子功能程序的权重, 为子功能程序的数量,为第 个子功能程序处理的第 个特征数据, 为第 个子功能程序处理的特征数据的数量, 为第 个特征数据与其对应的标准特征数据 之间的差距;

步骤S150、云端将分析结果返回给终端,作为对分析请求的响应。

2.根据权利要求1所述的基于云计算的大数据信息分析方法,其特征在于,云端接收终端的分析请求后,解析所述分析请求,得到待分析数据的标识,依据待分析数据的标识在云端查找得到待分析数据。

3.根据权利要求1所述的基于云计算的大数据信息分析方法,其特征在于,待查找得到待分析数据后,计算每一个待分析数据的综合特征与云端中的每一个子功能程序的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序,以调用所匹配的子功能程序。

4.根据权利要求1‑3任一项所述的基于云计算的大数据信息分析方法,其特征在于,被调用的子功能程序对归该子功能程序处理的所有待分析数据提取特征数据,对特征数据进行处理,以得到处理结果。

5.根据权利要求4所述的基于云计算的大数据信息分析方法,其特征在于,在特征数据提取后,计算待分析数据提取特征数据后的特征损失率,若特征损失率小于预设值,则通过提取出来的特征数据进行处理,以得到处理结果;若特征损失率不小于预设值,则通过待分析数据的所有特征数据进行处理以得到处理结果。

6.一种基于云计算的大数据信息分析系统,其特征在于,包括:云端和终端,云端包括:通信模块、查找模块、调用模块、多个子功能程序和融合模块;

云端的通信模块接收终端发送的分析请求,并且查找模块在云端查找得到待分析数据;

调用模块为查找到的待分析数据调用匹配的子功能程序;

被调用的子功能程序对待分析数据进行处理;

融合模块将多个子功能程序的处理结果进行融合,得到分析结果;

通过公式 ,对多个子功能程序的

处理结果进行融合,得到分析结果;

其中, 为分析结果, 为第 个子功能程序的权重, 为子功能程序的数量为第 个子功能程序处理的第 个特征数据, 为第 个子功能程序处理的特征数据的数量, 为第 个特征数据与其对应的标准特征数据 之间的差距;

云端的通信模块将分析结果返回给终端,作为对分析请求的响应。

7.根据权利要求6所述的基于云计算的大数据信息分析系统,其特征在于,云端还包括:解析模块,云端的通信模块接收终端的分析请求后,云端的解析模块解析所述分析请求,得到待分析数据的标识,查找模块依据待分析数据的标识在云端查找得到待分析数据。

8.根据权利要求6所述的基于云计算的大数据信息分析系统,其特征在于,待查找模块查找得到待分析数据后,调用模块计算每一个待分析数据的综合特征与云端中的每一个子功能程序的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序,以调用所匹配的子功能程序。

9.根据权利要求6‑8任一项所述的基于云计算的大数据信息分析系统,其特征在于,被调用的子功能程序对归该子功能程序处理的所有待分析数据提取特征数据,对特征数据进行处理,以得到处理结果。

10.根据权利要求9所述的基于云计算的大数据信息分析系统,其特征在于,在特征数据提取后,计算待分析数据提取特征数据后的特征损失率,若特征损失率小于预设值,则通过提取出来的特征数据进行处理,以得到处理结果;若特征损失率不小于预设值,则通过待分析数据的所有特征数据进行处理以得到处理结果。

说明书 :

一种基于云计算的大数据信息分析方法及系统

技术领域

[0001] 本申请涉及数据处理领域,尤其涉及一种基于云计算的大数据信息分析方法及系统。

背景技术

[0002] 近年来,随着互联网的迅速发展,大量的应用的使用也越来越普及,在应用的使用过程中所产生的数据也呈爆发式增长。目前,通常会将大量的数据存储在云端,以通过“云”为我们提供各种各样的服务,例如:存储服务、分析服务等。
[0003] 但是,由于应用的种类不断增加,而不同种类的应用所产生的数据的种类也不同,所以需要在云端部署不同种类的计算处理程序,以满足对不同种类的数据的处理。
[0004] 然而,在云端部署不同种类的计算处理程序,避免会对云端的性能造成影响,因此如何使云端能够满足对不同种类的数据的处理,同时还能够减少对运算的性能的影响,是目前本领域技术人员急需解决的技术问题。

发明内容

[0005] 本申请提供了一种基于云计算的大数据信息分析方法及系统,以使云端能够满足对不同种类的数据的处理,同时还能够减少对运算的性能的影响。
[0006] 为解决上述技术问题,本申请提供如下技术方案:
[0007] 一种基于云计算的大数据信息分析方法,包括如下步骤:步骤S110、云端接收终端发送的分析请求,并且在云端查找得到待分析数据;步骤S120、为查找到的待分析数据调用匹配的子功能程序;步骤S130、被调用的子功能程序对待分析数据进行处理;步骤S140、将多个子功能程序的处理结果进行融合,得到分析结果;步骤S150、云端将分析结果返回给终端,作为对分析请求的响应。
[0008] 如上所述的基于云计算的大数据信息分析方法,其中,优选的是,云端接收终端的分析请求后,解析所述分析请求,得到待分析数据的标识,依据待分析数据的标识在云端查找得到待分析数据。
[0009] 如上所述的基于云计算的大数据信息分析方法,其中,优选的是,待查找得到待分析数据后,计算每一个待分析数据的综合特征与云端中的每一个子功能程序的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序,以调用所匹配的子功能程序。
[0010] 如上所述的基于云计算的大数据信息分析方法,其中,优选的是,被调用的子功能程序对归该子功能程序处理的所有待分析数据提取特征数据,对特征数据进行处理,以得到处理结果。
[0011] 如上所述的基于云计算的大数据信息分析方法,其中,优选的是,在特征数据提取后,计算待分析数据提取特征数据后的特征损失率,若特征损失率小于预设值,则通过提取出来的特征数据进行处理,以得到处理结果;若特征损失率不小于预设值,则通过待分析数据的所有特征数据进行处理以得到处理结果。
[0012] 一种基于云计算的大数据信息分析系统,包括:云端和终端,云端包括:通信模块、查找模块、调用模块、多个子功能程序和融合模块;云端的通信模块接收终端发送的分析请求,并且查找模块在云端查找得到待分析数据;调用模块为查找到的待分析数据调用匹配的子功能程序;被调用的子功能程序对待分析数据进行处理;融合模块将多个子功能程序的处理结果进行融合,得到分析结果;云端的通信模块将分析结果返回给终端,作为对分析请求的响应。
[0013] 如上所述的基于云计算的大数据信息分析系统,其中,优选的是,云端还包括:解析模块,云端的通信模块接收终端的分析请求后,云端的解析模块解析所述分析请求,得到待分析数据的标识,查找模块依据待分析数据的标识在云端查找得到待分析数据。
[0014] 如上所述的基于云计算的大数据信息分析系统,其中,优选的是,待查找模块查找得到待分析数据后,调用模块计算每一个待分析数据的综合特征与云端中的每一个子功能程序的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序,以调用所匹配的子功能程序。
[0015] 如上所述的基于云计算的大数据信息分析系统,其中,优选的是,被调用的子功能程序对归该子功能程序处理的所有待分析数据提取特征数据,对特征数据进行处理,以得到处理结果。
[0016] 如上所述的基于云计算的大数据信息分析系统,其中,优选的是,在特征数据提取后,计算待分析数据提取特征数据后的特征损失率,若特征损失率小于预设值,则通过提取出来的特征数据进行处理,以得到处理结果;若特征损失率不小于预设值,则通过待分析数据的所有特征数据进行处理以得到处理结果。
[0017] 相对上述背景技术,由于本申请中在云端部署了实现不同功能的子功能程序,所以在进行数据分析时,可以依据不同的数据匹配多个不同功能的子功能程序,从而组合完成相应的数据分析,因此避免了部署不同种类的计算处理程序,从而可以使云端能够满足对不同种类的数据的处理,同时还能够减少对运算的性能的影响。

附图说明

[0018] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0019] 图1是本申请实施例提供的基于云计算的大数据信息分析方法的流程图;
[0020] 图2是本申请实施例提供的基于云计算的大数据信息分析系统的示意图。

具体实施方式

[0021] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0022] 实施例一
[0023] 请参阅图1,图1是本申请实施例提供的基于云计算的大数据信息分析方法的流程图。
[0024] 本申请提供了一种基于云计算的大数据信息分析方法,包括如下步骤:
[0025] 步骤S110、云端接收终端发送的分析请求,并且在云端查找得到待分析数据;
[0026] 在云端中存储有不同种类的应用(例如:支付软件、社交软件、短视频软件等)的数据(例如:支付软件的个人信息、支付软件的交易信息,社交软件的个人信息、社交软件的语音信息、社交软件的图片信息、社交软件的交易信息,短视频软件的个人信息、短视频软件的图片信息、短视频软件的视频信息、短视频软件的语音信息等)。
[0027] 在用户有分析需求时,终端生成分析请求,分析请求中包含有待分析数据的标识,例如:分析请求是分析短视频软件所产生的数据,以得到该用户感兴趣的内容特征,所以在该分析请求中包含有短视频软件所产生的数据的标识。
[0028] 云端接收终端的分析请求后,解析该分析请求,得到待分析数据的标识,然后依据待分析数据的标识在云端查找得到待分析数据。例如:依据得到的标识,从存储在云端的短视频软件所产生的数据中,查找得到待分析数据。
[0029] 步骤S120、为查找到的待分析数据调用匹配的子功能程序;
[0030] 在云端上部署有数据分析程序,以对数据进行分析处理。本申请中,数据分析程序被按照不同的功能分解为多个子功能程序,例如:个人信息处理子功能程序、交易信息处理子功能程序、图片信息处理子功能程序、语音信息处理子功能程序、视频信息处理子功能程序等。作为一个例子,在对短视频软件所产生的数据进行分析时,可以使用个人信息处理子功能程序、图片信息处理子功能程序、语音信息处理子功能程序、视频信息处理子功能程序等。并且,本申请中还预先为每个子功能程序设置了类别特征,用于标识其功能。
[0031] 待查找得到待分析数据后,计算每一个待分析数据的综合特征与云端中的每一个子功能程序的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序,并调用所匹配的子功能程序,以处理该待分析数据。由于查找到的待分析数据不仅仅是一个数据,一般情况下是多个数据,因此根据待分析数据的种类的不同,通常会匹配多个不同功能的子功能程序,以对查找得到的所有待分析数据进行处理。
[0032] 具体的,通过公式 计算待分析数据的综合特征与每一个子功能程序的类别特征之间的相似度; 是第 个待分析数据的综合特征,并且 , 为该待分析数据的第 个特征, 为第 个特征
对应的权重值, 为该待分析数据的特征的数量; 是第 个子功能程序的类别特征;
是 与 之间的相似度; 为相对熵,并且, ,因
此 , 。
[0033] 步骤S130、被调用的子功能程序对待分析数据进行处理;
[0034] 为每个待分析数据调用匹配的子功能程序后,该子功能程序对归其分析的待分析数据进行处理。通常查找得到的待分析数据都具有很多的数据,所以即使调用了多个子功能程序,被调用的每一个子功能程序也会处理很多待分析数据,因此每一个被调用的子功能程序在对归其处理的待分析数据进行处理前,优选还对归该子功能程序处理的所有待分析数据提取特征数据,并对特征数据进行处理,从而减少了该子功能程序的数据处理量。具体的,计算待分析数据中的每个特征数据的均值和方差,并且将计算得到的方差与基础阈值进行比较,若一个特征数据的方差大于基础阈值,则提取该特征数据,若一个特征数据的方差不大于基础阈值,则放弃该特征数据,从而完成对待分析数据的特征数据的提取。
[0035] 另外,由于特征数据的提取会造成特征的丢失,因此本申请中在特征数据提取后,还计算待分析数据提取特征数据后的特征损失率。具体的,通过公式计算得到一个待分析数据提取特征数据后的特征损失率 ,其中, 为从该待分析数据中提取到的所有特征数据的数量, 为从该分析数据中提取到的第 个特征数据, 为从该分析数据中提取到的第 个特征数据的权重, 为该待分析数据中的所有特征数据的数量, 为该待分析数据中的第 个特征数据, 为待分析数据中的第 个特征数据的权重。
[0036] 在计算得到特征损失率后,比较特征损失率与预设值,以获得特征提取对处理结果的影响程度。具体的,若特征损失率小于预设值,则认为特征提取对处理结果的影响程度在可控范围内,可通过提取出来的特征数据进行处理;若特征损失率不小于预设值,则认为特征提取对处理结果的影响程度在不可控范围内,不能通过提取出来的特征数据进行处理,这种情况下需要通过该待分析数据的所有特征数据进行处理。
[0037] 步骤S140、将多个子功能程序的处理结果进行融合,得到分析结果;
[0038] 在多个子功能程序得到处理结果后,需要将这些子功能程序得到的这些处理结果进行融合,以得到用户发送的分析请求所需要的分析结果。具体的,通过公式,对多个子功能程序的处理结果进行融合,得到分析结果。其中, 为分析结果, 为第 个子功能程序的权重, 为子功能程序的数量, 为第 个子功能程序处理的第 个特征数据, 为第 个子功能程序处理的特征数据的数量, 为第 个特征数据与其对应的标准特征数据 之间的差距。
[0039] 步骤S150、云端将分析结果返回给终端,作为对分析请求的响应;
[0040] 在云端得到分析结果后,云端将分析结果作为对分析请求的响应返回给终端,以在终端中展示给用户。
[0041] 实施例二
[0042] 请参阅图2,图2是本申请实施例提供的基于云计算的大数据信息分析系统的示意图。
[0043] 本申请提供了一种基于云计算的大数据信息分析系统,包括:云端210和终端220,云端210包括:通信模块211、查找模块212、调用模块213、多个子功能程序214和融合模块215。
[0044] 云端210的通信模块211接收终端220发送的分析请求,并且查找模块212在云端210查找得到待分析数据。
[0045] 在云端210中存储有不同种类的应用(例如:支付软件、社交软件、短视频软件等)的数据(例如:支付软件的个人信息、支付软件的交易信息,社交软件的个人信息、社交软件的语音信息、社交软件的图片信息、社交软件的交易信息,短视频软件的个人信息、短视频软件的图片信息、短视频软件的视频信息、短视频软件的语音信息等)。
[0046] 在用户有分析需求时,终端220生成分析请求,分析请求中包含有待分析数据的标识,例如:分析请求是分析短视频软件所产生的数据,以得到该用户感兴趣的内容特征,所以在该分析请求中包含有短视频软件所产生的数据的标识。
[0047] 云端210还包括解析模块216,云端210的通信模块211接收终端220的分析请求后,云端210的解析模块216解析该分析请求,得到待分析数据的标识,然后查找模块212依据待分析数据的标识在云端210查找得到待分析数据。例如:依据得到的标识,从存储在云端的短视频软件所产生的数据中,查找得到待分析数据。
[0048] 调用模块213为查找到的待分析数据调用匹配的子功能程序。
[0049] 在云端210上部署有数据分析程序,以对数据进行分析处理。本申请中,数据分析程序被按照不同的功能分解为多个子功能程序214,例如:个人信息处理子功能程序、交易信息处理子功能程序、图片信息处理子功能程序、语音信息处理子功能程序、视频信息处理子功能程序等。作为一个例子,在对短视频软件所产生的数据进行分析时,可以使用个人信息处理子功能程序、图片信息处理子功能程序、语音信息处理子功能程序、视频信息处理子功能程序等。并且,本申请中还预先为每个子功能程序设置了类别特征,用于标识其功能。
[0050] 待查找模块212查找得到待分析数据后,调用模块213计算每一个待分析数据的综合特征与云端中的每一个子功能程序214的类别特征之间的相似度,为每一个待分析数据匹配与其综合特征相似度最高的子功能程序214,并调用所匹配的子功能程序214,以处理该待分析数据。由于查找模块212查找到的待分析数据不仅仅是一个数据,一般情况下是多个数据,因此根据待分析数据的种类的不同,通常调用模块213会匹配多个不同功能的子功能程序214,以对查找得到的所有待分析数据进行处理。
[0051] 具体的,通过公式 计算待分析数据的综合特征与每一个子功能程序214的类别特征之间的相似度; 是第 个待分析数据的综合特征,并且 , 为该待分析数据的第 个特征, 为第
个特征对应的权重值, 为该待分析数据的特征的数量; 是第 个子功能程序的类别特征; 是 与 之间的相似度; 为相对熵,并且,
,因此 ,

[0052] 被调用的子功能程序214对待分析数据进行处理。
[0053] 为每个待分析数据调用匹配的子功能程序214后,该子功能程序214对归其分析的待分析数据进行处理。通常查找得到的待分析数据都具有很多的数据,所以即使调用了多个子功能程序214,被调用的每一个子功能程序214也会处理很多待分析数据,因此每一个被调用的子功能程序214在对归其处理的待分析数据进行处理前,优选还对归该子功能程序214处理的所有待分析数据提取特征数据,并对特征数据进行处理,从而减少了该子功能程序214的数据处理量。具体的,计算待分析数据中的每个特征数据的均值和方差,并且将计算得到的方差与基础阈值进行比较,若一个特征数据的方差大于基础阈值,则提取该特征数据,若一个特征数据的方差不大于基础阈值,则放弃该特征数据,从而完成对待分析数据的特征数据的提取。
[0054] 另外,由于特征数据的提取会造成特征的丢失,因此本申请中在特征数据提取后,还计算待分析数据提取特征数据后的特征损失率。具体的,通过公式计算得到一个待分析数据提取特征数据后的特征损失率 ,其中, 为从该待分析数据中提取到的所有特征数据的数量, 为从该分析数据中提取到的第 个特征数据, 为从该分析数据中提取到的第 个特征数据的权重, 为该待分析数据中的所有特征数据的数量, 为该待分析数据中的第 个特征数据, 为待分析数据中的第 个特征数据的权重。
[0055] 在计算得到特征损失率后,比较特征损失率与预设值,以获得特征提取对处理结果的影响程度。具体的,若特征损失率小于预设值,则认为特征提取对处理结果的影响程度在可控范围内,可通过提取出来的特征数据进行处理;若特征损失率不小于预设值,则认为特征提取对处理结果的影响程度在不可控范围内,不能通过提取出来的特征数据进行处理,这种情况下需要通过该待分析数据的所有特征数据进行处理。
[0056] 融合模块215将多个子功能程序214的处理结果进行融合,得到分析结果。
[0057] 在多个子功能程序214得到处理结果后,融合模块215需要将这些子功能程序214得到的这些处理结果进行融合,以得到用户发送的分析请求所需要的分析结果。
[0058] 具体的,通过公式 ,对多个子功能程序的处理结果进行融合,得到分析结果。其中, 为分析结果, 为第 个子功能程序的权重, 为子功能程序的数量, 为第 个子功能程序处理的第 个特征数据,为第 个子功能程序处理的特征数据的数量, 为第 个特征数据与其对应的标准特征数据 之间的差距。
[0059] 云端210的通信模块211将分析结果返回给终端220,作为对分析请求的响应。
[0060] 在云端210得到分析结果后,云端210的通信模块211将分析结果作为对分析请求的响应返回给终端220,以在终端220中展示给用户。
[0061] 本申请中,由于在云端部署了实现不同功能的子功能程序,因此在进行数据分析时,可以依据不同的数据匹配多个不同功能的子功能程序,从而组合完成相应的数据分析,因此避免了部署不同种类的计算处理程序,从而可以使云端能够满足对不同种类的数据的处理,同时还能够减少对运算的性能的影响。
[0062] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0063] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。