一种基于大数据的互联网络平台用户行为分析系统转让专利

申请号 : CN202211627028.9

文献号 : CN115840844B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张伟彭海坤袁环张连霞

申请人 : 深圳市新联鑫网络科技有限公司

摘要 :

本发明公开了一种基于大数据的互联网络平台用户行为分析系统,具体涉及大数据分析技术领域,其中异常言论识别模块包括下列步骤:步骤S01、输入文本的训练:从数据存储模块中获得待测数据样本,所述数据样本为评论文本,将评论文本表示为序列向量,设共有t条评论文本,将每个字符转化为模型可处理的数字,最后进行映射,映射为128维的字符向量;步骤S02、特征提取:将步骤S01得到的字符向量进行双向序列提取,将X1输入卷积神经网络的池化层进行卷积操作,得到评论文本的特征向量,将特征向量传输至卷积神经网络的全连接层;步骤S03、结果分类:在全连接层中接入激活函数F(x),然后接入分类器输出分类结果。

权利要求 :

1.一种基于大数据的互联网络平台用户行为分析系统,包括数据采集模块、数据预处理模块、数据存储模块、异常言论识别模块、用户影响力评估模块、异常监测模块,其特征在于:所述数据采集模块用于采集互联网络平台中用户数据,并将采集的数据传输至数据预处理模块;所述数据预处理模块用于处理数据,对数据进行清洗、扰动和标记,将预处理后的数据传输至数据存储模块;所述数据存储模块用于存储预处理后的数据并等待异常言论识别模块的调用;所述异常言论识别模块调用存储模块中的数据,识别数据中用户的异常言论,并将结果传输至用户影响力评估模块;所述用户影响力评估模块用于评估异常用户的影响力,将超出预设值的异常用户名单传输至异常监测模块,所述异常监测模块用于监测异常用户的行为,获得实时数据,加强对该用户的检测,将多次异常行为用户标记为黑名单,将黑名单用户传输至数据存储模块中的共享单元,数据共享单元将黑名单传输至各互联网络平台;

所述异常言论识别模块基于深度学习算法构建异常言论识别模型,包括文本训练单元、特征识别单元、结果分类单元,异常言论识别模块包括下列步骤:步骤S01、输入文本的训练:从数据存储模块中获得待测数据样本,所述数据样本为评论文本,将评论文本表示为序列向量,设共有t条评论文本,每条文本包括z个字符,第i条评论表示为di={wi1,wi2,...wiz},其中w表示字符,将每个字符转化为模型可处理的数字,表示为Si={si1,si2,...,siz},最后进行映射,映射为128维的字符向量;

1 1

步骤S02、特征提取:将步骤S01得到的字符向量Si进行双向序列提取,得到X ,X包含了

1

Si的时间序列信息、语义序列信息和其他序列信息;将X 输入卷积神经网络的池化层进行卷积操作,得到评论文本的特征向量,将特征向量传输至卷积神经网络的全连接层,其中W表示特征字符的权重,b表示偏置参数;

步骤S03、结果分类:在全连接层中接入激活函数F(x),为模型加入非线性因素,然后接入分类器输出分类结果,得到异常言论用户名单和对应的异常言论;

所述影响力评估模块包括数据爬取单元、分类评分单元、构建评估模型单元、结果判断单元,先计算用户的粉丝数、点赞数、活跃度,社交网络评分,通过公式计算得到用户影响力综合评分,当影响力超出预设值的异常用户实施实时监测,包括下列步骤:步骤S11、数据爬取:根据异常用户的名单,爬取用户的详细信息,得到数据集;

步骤S12、分类评分:对用户粉丝数、点赞数、活跃度、社交网络价值进行分类,得到四组数据集,然后设置评分规则,为用户的四个方面进行评估,得到四组分数;

步骤S13、构建评估模型:将四组评分代入模型中 计算得

到用户的影响力综合评分,其中A表示用户粉丝数评分,根据粉丝数量分为1‑5个级别,Ai表示第i各互联网络平台的用户粉丝数评分,所述B表示用户的被点赞数,根据点赞数量分为

1‑5个级别,Bi表示第i各互联网络平台用户被点赞数;所述活跃度H包括发帖输出活跃度h1和留评活跃度h2,Hi表示第i个互联网络平台的发帖活跃度,其中所述社交网络价值P包社交网络的丰富度p1和亲密社交关系价值评分p2,Pi表示第i个互联网络平台的发帖活跃度,所述活跃度的计算公式为 其中c1表示常数,w1表 示发帖 输出活跃 度h1 权重 ;所 述社交 网络价 值P的计 算公式 为其中c2表示常数,w2表示发帖输出活跃度p1权重;

步骤S14、结果判断单元:判断用户影响力综合评分结果是否超出预设值,将超出预设值的用户名单传输至异常监测模块。

2.根据权利要求1所述的一种基于大数据的互联网络平台用户行为分析系统,其特征在于:所述激活函数为F(x)满足公式 其中x表示卷积神经网络池化层的输入,其中a表示池化层的输出,b表示偏置参数。

3.根据权利要求1所述的一种基于大数据的互联网络平台用户行为分析系统,其特征在于:所述权重W的计算模型为 其中W表示特征字符的权重,Fin表示第n个特征字符在第i个样本中出现的次数,M表示总的样本总数,mn表示出现第n个特征字符的次数,α表示系数参数。

4.根据权利要求1所述的一种基于大数据的互联网络平台用户行为分析系统,其特征在于:所述数据预处理模块包括用于去除无关词语的数据清洗单元、用于隐私保护的数据扰动单元和数据标记单元,所述数据扰动单元通过扰动算法保护用户隐私,扰动算法包括下列步骤:在数据集中,假设属性总量为I,其中I包括数据集中的机密属性在内;计算所有I个属性的方差,并假设j′为I个属性中方差最大的属性;计算属性j′中数据的均值,并按均值把j′中的数据分为2个子集;对任意两个子节点,重复计算方差、计算均值的步骤,当子节点包含不到预指定记录数量时,用得到的均值替换隐私数据来对数据进行扰动。

5.根据权利要求1所述的一种基于大数据的互联网络平台用户行为分析系统,其特征在于:所述数据存储单元包括原始数据存储单元、分析结果存储单元和临时缓存单元,所述原始数据存储单元用于存储预处理模块得到的数据;所述分析结果存储单元用于存储异常言论识别模块、用户影响力评估模块、异常监测模块产生的数据;所述临时缓存单元用于存储热门的分析数据进行存储和实时采集数据,以加快系统响应速度。

6.一种基于大数据的互联网络平台用户行为分析方法,用于实施上述权利要求1‑5任一所述的一种基于大数据的互联网络平台用户行为分析系统,其特征在于:所述方法包括下列步骤:步骤S21、数据预处理:将采集用户数据处理后传输至数据存储单元等待调用;

步骤S22、构建异常用户言论识别模型:通过模型输入文本训练、特征提取、结果分类,得到异常用户名单,以及对应的异常言论,将异常用户名单传输至用户影响力评估步骤;

步骤S23、用户的影响力评估:通过用户的粉丝数、点赞数、活跃度,社交网络评分,计算得到用户的影响力评分,将影响力大的异常用户名单传输至实时监测步骤;

步骤S24、实时监测:监测异常用户的实时行为,及时得到异常用户黑名单,并将异常用户黑名单传输至数据存储模块;

步骤S25、数据共享:提取黑名单用户的特征,将黑名单用户传输至数据存储模块中的共享单元,所述数据共享单元将黑名单传输至各互联网络平台,互联网络在接收黑名单后,根据用户在平台的留存率采取措施。

7.根据权利要求6所述的一种基于大数据的互联网络平台用户行为分析方法,其特征在于:所述用户留存率为用户在时间d内的出现频次,用折线图对一段时间内的用户留存率进行刻画,将最长的时间跨度设置为60天,并对这60天内的次日留存、2日后的留存、3日后的留存、4日后留存、5日后留存、6日后留存、7日后留存、15日后留存、30日后留存、60日后留存使用9种颜色不同的折线来表示。

说明书 :

一种基于大数据的互联网络平台用户行为分析系统

技术领域

[0001] 本发明涉及大数据分析技术领域,更具体地说,本发明涉及一种基于大数据的互联网络平台用户行为分析系统。

背景技术

[0002] 互联网络平台指的是为用户提供技术支持、服务的基础设施,互联网络平台间互联互通,按照使用方向分为:互联网内容平台、互联网服务平台、互联网电商平台,新一轮科技革命和产业变革加速推进,数字技术创新实现多点突破,以5G、人工智能、物联网、工业互联网、卫星互联网为代表的新型信息基础设施正逐步成为全球经济增长的新动能,人们在线上的时间越来越多,每日出现在不同的互联网络平台,用户在互联网内容平台中产生大量评论。
[0003] 网络安全关系到现实安全,现在网络平台中存在越来越多的异常操作,例如反动言论、攻击言论,通过对互联网络平台中用户行为分析能够得到异常用户,定位异常痕迹,进而保证安全。
[0004] 目前不同的互联网络用户平台都采用了用户言论分析,通过提取特征识别异常言论,从而打造良好的网络环境,不同的互联网络平台的分析的用户行为侧重点不同,现有的用户异常行为监测模块中监测方法过于单一,依赖用户举报,缺少实时监测预警功能,同时各平台间缺少信息共享,导致资源浪费。

发明内容

[0005] 为了克服现有技术的上述缺陷,本发明的实施例提供一种基于大数据的互联网络平台用户行为分析系统,通过提供一种异常言论识别模型识别大数据中的异常言论,得到异常用户名单,再通过影响力评估单元评估异常用户的影响力,根据综合影响力得到需要实时监测的用户名单,最后根据监测结果得到黑名单,并将黑名单共享至其他互联网络平台,从而达到有效监管,以解决上述背景技术中提出的用户行为监测不及时、监测效率低、数据缺少共享问题。
[0006] 为实现上述目的,本发明提供如下技术方案:一种基于大数据的互联网络平台用户行为分析系统,包括数据采集模块、数据预处理模块、数据存储模块、异常言论识别模块、用户影响力评估模块、异常监测模块,
[0007] 所述数据采集模块用于采集互联网络平台中用户数据,并将采集的数据传输至数据预处理模块;所述数据预处理模块用于处理数据,对数据进行清洗、扰动和标记,将预处理后的数据传输至数据存储模块;所述数据存储模块用于存储预处理后的数据并等待异常言论识别模块的调用;所述异常言论识别模块调用存储模块中的数据,识别数据中用户的异常言论,并将结果传输至用户影响力评估模块;所述用户影响力评估模块用于评估异常用户的影响力,将超出预设值的异常用户名单传输至异常监测模块,所述异常监测模块用于监测异常用户的行为,获得实时数据,加强对该用户的检测,将多次异常行为用户标记为黑名单,将黑名单用户传输至数据存储模块中的共享单元,所述数据共享单元将黑名单传输至各互联网络平台;
[0008] 所述异常言论识别模块基于深度学习算法构建异常言论识别模型,包括文本训练单元、特征识别单元、结果分类单元,异常言论识别模块包括下列步骤:
[0009] 步骤S01、输入文本的训练:从数据存储模块中获得待测数据样本,所述数据样本为评论文本,将评论文本表示为序列向量,设共有t条评论文本,每条文本包括z个字符,第i条评论表示为di={wi1,wi2,...wiz},其中w表示字符,将每个字符转化为模型可处理的数字,表示为Si={si1,si2,...,siz},最后进行映射,映射为128维的字符向量;
[0010] 步骤S02、特征提取:将步骤S01得到的字符向量Si进行双向序列提取,得到X1,X1包1
含了Si的时间序列信息、语义序列信息和其他序列信息;将X 输入卷积神经网络的池化层进行卷积操作,得到评论文本的特征向量,将特征向量传输至卷积神经网络的全连接层,其中W表示特征字符的权重,b表示偏置参数;
[0011] 步骤S03、结果分类:在全连接层中接入激活函数F(x),为模型加入非线性因素,然后接入分类器输出分类结果,得到异常言论用户名单和对应的异常言论。
[0012] 在 一个 优 选 地实 施 方 式中 ,所 述 激活 函 数 为F (x) 满 足 公式其中x表示卷积神经网络池化层的输入,其中a表示池化层的输出,b表示偏置参数。
[0013] 在一个优选地实施方式中,所述权重W的计算模型为 其中W表示特征字符的权重,Fin表示第n个特征字符在第i个样本中出现的次数,M表示总的样本总数,mn表示出现第n个特征字符的次数,α表示系数参数。
[0014] 在一个优选地实施方式中,所述数据预处理模块包括用于去除无关词语的数据清洗单元、用于隐私保护的数据扰动单元和数据标记单元,所述数据扰动单元通过扰动算法保护用户隐私,扰动算法包括下列步骤:所述在数据集中,假设属性总量为I,其中I包括数据集中的机密属性在内;计算所有I个属性的方差,并假设j′为I个属性中方差最大的属性;计算属性j′中数据的均值,并按均值把j′中的数据分为2个子集;对任意两个子节点,重复计算方差、计算均值的步骤,当子节点包含不到预指定记录数量时,用得到的均值替换隐私数据来对数据进行扰动。
[0015] 在一个优选地实施方式中,所述影响力评估模块包括数据爬取单元、分类评分单元、构建评估模型单元、结果判断单元,先计算用户的粉丝数、点赞数、活跃度,社交网络评分,通过公式计算得到用户影响力综合评分,当影响力超出预设值的异常用户实施实时监测,包括下列步骤:
[0016] 步骤S11、数据爬取:根据异常用户的名单,爬取用户的详细信息,得到数据集;
[0017] 步骤S12、分类评分:先用户粉丝数、点赞数、活跃度、社交网络价值进行分类,得到四组数据集,然后设置评分规则,为用户的四个方面进行评估,得到四组分数;
[0018] 步骤S13、构建评估模型:将四组评分代入模型中 计算得到用户的影响力综合评分,其中A表示用户粉丝数评分,根据粉丝数量分为1‑5个级别,Ai表示第i各互联网络平台的用户粉丝数评分,所述B表示用户的被点赞数,根据点赞数量分为1‑5个级别,Bi表示第i各互联网络平台用户被点赞数;
[0019] 步骤S14、结果判断单元:判断用户影响力综合评分结果是否超出预设值,将超出预设值的用户名单传输至异常监测模块。
[0020] 在一个优选地实施方式中,所述活跃度H包括发帖输出活跃度h1和留评活跃度h2,Hi表示第i个互联网络平台的发帖活跃度,其中所述社交网络价值P包社交网络的丰富度p1和亲密社交关系价值评分p2,Pi表示第i个互联网络平台的发帖活跃度,所述活跃度的计算公式为 其中c1表示常数,w1表示发帖输出活跃度h1权重;所述社交网络价值P的计算公式为
其中c2表示常数,w2表示发帖输出活跃度p1权重。
[0021] 在一个优选地实施方式中,所述数据存储单元包括原始数据存储单元、分析结果存储单元和临时缓存单元,所述原始数据存储单元用于存储预处理模块得到的数据;所述分析结果存储单元用于存储异常言论识别模块、用户影响力评估模块、异常监测模块产生的数据;所述临时缓存单元用于存储热门的分析数据进行存储和实时采集数据,以加快系统响应速度。
[0022] 为实现上述目的,本发明提供如下技术方案:一种基于大数据的互联网络平台用户行为分析系统的方法,所述方法包括下列步骤:
[0023] 步骤S21、数据预处理:将采集用户数据处理后传输至数据存储单元等待调用;
[0024] 步骤S22、构建异常用户言论识别模型:通过模型输入文本训练、特征提取、结果分类,得到异常用户名单,以及对应的异常言论,将异常用户名单传输至用户影响力评估步骤;
[0025] 步骤S23、用户的影响力评估:通过用户的粉丝数、点赞数、活跃度,社交网络评分,计算得到用户的影响力评分,将影响力大的异常用户名单传输至实时监测步骤;
[0026] 步骤S24、实时监测:监测异常用户的实时行为,及时得到异常用户黑名单,并将异常用户黑名单传输至数据存储模块;
[0027] 步骤S25、数据共享:提取黑名单用户的特征,将黑名单用户传输至数据存储模块中的共享单元,所述数据共享单元将黑名单传输至各互联网络平台,互联网络在接收黑名单后,根据用户在平台的留存率采取措施。
[0028] 在一个优选地实施方式中,所述用户留存率为用户在时间d内的出现频次,用折线图对一段时间内的用户留存率进行刻画,将最长的时间跨度设置为60天,并对这60天内的次日留存、2日后的留存、3日后的留存、4日后留存、5日后留存、6日后留存、7日后留存、15日后留存、30日后留存、60日后留存使用9种颜色不同的折线来表示。
[0029] 本发明的技术效果和优点:
[0030] 本发明通过提供一种异常言论识别模型识别大数据中的异常言论,得到异常用户名单,再通过影响力评估单元评估异常用户的影响力,根据综合影响力得到需要实时监测的用户名单,最后根据监测结果得到黑名单,并将黑名单共享至其他互联网络平台,从而提高监管效率,节约了计算资源;在数据处理中采用扰动算法,对相关联的属性添加噪声,同时在无关联的属性中进行扰动,从而拓宽了隐私保护的范围,减少了数据挖掘中的偏差。

附图说明

[0031] 图1为本发明的系统结构框图。
[0032] 图2为本发明的异常言论识别模块的流程图。
[0033] 图3为本发明的影响力评估方法流程图。
[0034] 图4为本发明系统的方法流程图。

具体实施方式

[0035] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0036] 本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。
[0037] 本发明中的互联网络平台通过给对方提供接口,实现相互兼容,用户可以通过接口从一个平台进入另一个平台。
[0038] 实施例1
[0039] 本实施例提供了如图1所示一种基于大数据的互联网络平台用户行为分析系统,包括数据采集模块、数据预处理模块、数据存储模块、异常言论识别模块、用户影响力评估模块、异常监测模块,
[0040] 所述数据采集模块用于采集互联网络平台中用户数据,并将采集的数据传输至数据预处理模块;所述数据预处理模块用于处理数据,对数据进行清洗、扰动和标记,将预处理后的数据传输至数据存储模块;所述数据存储模块用于存储预处理后的数据并等待异常言论识别模块的调用;所述异常言论识别模块调用存储模块中的数据,识别数据中用户的异常言论,并将结果传输至用户影响力评估模块;所述用户影响力评估模块用于评估异常用户的影响力,将超出预设值的异常用户名单传输至异常监测模块,所述异常监测模块用于监测异常用户的行为,获得实时数据,加强对该用户的检测,将多次异常行为用户标记为黑名单,将黑名单用户传输至数据存储模块中的共享单元,所述数据共享单元将黑名单传输至各互联网络平台;
[0041] 如图二所示,所述异常言论识别模块基于深度学习算法构建异常言论识别模型,包括文本训练单元、特征识别单元、结果分类单元,异常言论识别模块包括下列步骤:
[0042] 步骤S01、输入文本的训练:从数据存储模块中获得待测数据样本,所述数据样本为评论文本,将评论文本表示为序列向量,设共有t条评论文本,每条文本包括z个字符,第i条评论表示为di={wi1,wi2,...wiz},其中w表示字符,将每个字符转化为模型可处理的数字,表示为Si={si1,si2,...,siz},最后进行映射,映射为128维的字符向量;
[0043] 步骤S02、特征提取:将步骤S01得到的字符向量Si进行双向序列提取,得到X1,X1包1
含了Si的时间序列信息、语义序列信息和其他序列信息;将X 输入卷积神经网络的池化层进行卷积操作,得到评论文本的特征向量,将特征向量传输至卷积神经网络的全连接层,其中W表示特征字符的权重,b表示偏置参数;
[0044] 步骤S03、结果分类:在全连接层中接入激活函数F(x),为模型加入非线性因素,然后接入分类器输出分类结果,得到异常言论用户名单和对应的异常言论。
[0045] 进一步的,所述激活函数为F(x)满足公式 其中x表示卷积神经网络池化层的输入,其中a表示池化层的输出,b表示偏置参数。
[0046] 进一步的,所述权重W的计算模型为 其中W表示特征字符的权重,Fin表示第n个特征字符在第i个样本中出现的次数,M表示总的样本总数,mn表示出现第n个特征字符的次数,α表示系数参数。
[0047] 进一步的,所述数据预处理模块包括用于去除无关词语的数据清洗单元、用于隐私保护的数据扰动单元和数据标记单元,所述数据扰动单元通过扰动算法保护用户隐私,扰动算法包括下列步骤:所述在数据集中,假设属性总量为I,其中I包括数据集中的机密属性在内;计算所有I个属性的方差,并假设j′为I个属性中方差最大的属性;计算属性j′中数据的均值,并按均值把j′中的数据分为2个子集;对任意两个子节点,重复计算方差、计算均值的步骤,当子节点包含不到预指定记录数量时,用得到的均值替换隐私数据来对数据进行扰动。
[0048] 进一步的,所述影响力评估模块包括数据爬取单元、分类评分单元、构建评估模型单元、结果判断单元,先计算用户的粉丝数、点赞数、活跃度,社交网络评分,通过公式计算得到用户影响力综合评分,当影响力超出预设值的异常用户实施实时监测,如图3所示,包括下列步骤:
[0049] 步骤S11、数据爬取:根据异常用户的名单,爬取用户的详细信息,得到数据集;
[0050] 步骤S12、分类评分:先用户粉丝数、点赞数、活跃度、社交网络价值进行分类,得到四组数据集,然后设置评分规则,为用户的四个方面进行评估,得到四组分数;
[0051] 步骤S13、构建评估模型:将四组评分代入模型中 计算得到用户的影响力综合评分,其中A表示用户粉丝数评分,根据粉丝数量分为1‑5个级别,Ai表示第i各互联网络平台的用户粉丝数评分,所述B表示用户的被点赞数,根据点赞数量分为1‑5个级别,Bi表示第i各互联网络平台用户被点赞数;
[0052] 步骤S14、结果判断单元:判断用户影响力综合评分结果是否超出预设值,将超出预设值的用户名单传输至异常监测模块。
[0053] 进一步的,所述活跃度H包括发帖输出活跃度h1和留评活跃度h2,Hi表示第i个互联网络平台的发帖活跃度,其中所述社交网络价值P包社交网络的丰富度p1和亲密社交关系价值评分p2,Pi表示第i个互联网络平台的发帖活跃度,所述活跃度的计算公式为其中c1表示常数,w1表示发帖输出活跃度h1权重;所述社交网络价值P的计算公式为 其中c2
表示常数,w2表示发帖输出活跃度p1权重。
[0054] 进一步的,所述数据存储单元包括原始数据存储单元、分析结果存储单元和临时缓存单元,所述原始数据存储单元用于存储预处理模块得到的数据;所述分析结果存储单元用于存储异常言论识别模块、用户影响力评估模块、异常监测模块产生的数据;所述临时缓存单元用于存储热门的分析数据进行存储和实时采集数据,以加快系统响应速度。
[0055] 为实现上述目的,本发明提供如下技术方案:一种基于大数据的互联网络平台用户行为分析系统,如图4所示,所述方法包括下列步骤:
[0056] 步骤S21、数据预处理:将采集用户数据处理后传输至数据存储单元等待调用;
[0057] 步骤S22、构建异常用户言论识别模型:通过模型输入文本训练、特征提取、结果分类,得到异常用户名单,以及对应的异常言论,将异常用户名单传输至用户影响力评估步骤;
[0058] 步骤S23、用户的影响力评估:通过用户的粉丝数、点赞数、活跃度,社交网络评分,计算得到用户的影响力评分,将影响力大的异常用户名单传输至实时监测步骤;
[0059] 步骤S24、实时监测:监测异常用户的实时行为,及时得到异常用户黑名单,并将异常用户黑名单传输至数据存储模块;
[0060] 步骤S25、数据共享:提取黑名单用户的特征,将黑名单用户传输至数据存储模块中的共享单元,所述数据共享单元将黑名单传输至各互联网络平台,互联网络在接收黑名单后,根据用户在平台的留存率采取措施。
[0061] 进一步的,所述用户留存率为用户在时间d内的出现频次,用折线图对一段时间内的用户留存率进行刻画,将最长的时间跨度设置为60天,并对这60天内的次日留存、2日后的留存、3日后的留存、4日后留存、5日后留存、6日后留存、7日后留存、15日后留存、30日后留存、60日后留存使用9种颜色不同的折线来表示。
[0062] 综上所述:提供一种异常言论识别模型识别大数据中的异常言论,得到异常用户名单,再通过影响力评估单元评估异常用户的影响力,根据综合影响力得到需要实时监测的用户名单,最后根据监测结果得到黑名单,并将黑名单共享至其他互联网络平台,通过影响力综合评分从异常用户名单中筛选出需要实时监测的用户名单,从而避免了对大量用户的实时监测,从而提高监管效率,节约了计算资源。
[0063] 本发明实施例仅仅提供一种实施方式,而不是具体地限定本发明的保护范围。
[0064] 最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。