基于大数据和业务分析的用户数据处理方法及服务器转让专利
申请号 : CN202011469139.2
文献号 : CN112463859B
文献日 : 2021-08-17
发明人 : 邢东进 , 杨洪进 , 王玉华
申请人 : 厦门蝉羽网络科技有限公司
摘要 :
权利要求 :
1.一种基于大数据和业务分析的用户数据处理方法,其特征在于,所述方法包括:获取针对用户业务终端的业务数据分析指令;
当基于所述业务数据分析指令确定所述用户业务终端处于业务数据交互状态时,基于所述业务数据分析指令确定用户数据分析策略;
获取与业务交互时段相关的业务交互对象和业务交互类型数据,基于所述与业务交互时段相关的业务交互对象得到目标业务交互对象数据;
基于所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据确定用户数据采集策略;
通过所述用户数据采集策略从所述用户业务终端中采集待处理用户数据,并基于所述用户数据分析策略对所述待处理用户数据进行用户画像分析,得到用户画像分析结果;
其中,所述基于所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据确定用户数据采集策略,包括:将所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据发送至预设的采集策略生成模型,在预设的采集策略生成模型中基于所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据确定用户数据采集策略;
其中,在预设的采集策略生成模型中基于所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据确定用户数据采集策略,包括:通过调用所述采集策略生成模型的数据整合单元,将所述业务交互类型数据及所述目标业务交互对象数据整合为采集策略匹配信息;通过调用所述采集策略生成模型的信息处理单元,生成所述分析策略指示信息对应的页面点击分析结果,生成所述采集策略匹配信息对应的用户行为模拟结果;其中,所述页面点击分析结果和所述用户行为模拟结果分别包括多个具有不同用户兴趣热度值的用户行为事件;
提取所述分析策略指示信息在所述页面点击分析结果的任一用户行为事件的原始用户访问轨迹信息,将所述用户行为模拟结果中具有最小用户兴趣热度值的用户行为事件确定为目标用户行为事件;通过所述信息处理单元,将所述原始用户访问轨迹信息映射到所述目标用户行为事件,在所述目标用户行为事件中得到原始访问轨迹映射信息,并根据所述原始用户访问轨迹信息、所述原始访问轨迹映射信息,生成所述分析策略指示信息和所述采集策略匹配信息之间的信息关联标签集;
以所述原始访问轨迹映射信息为参考信息在所述目标用户行为事件中获取业务交互描述信息,根据所述信息关联标签集对应的标签分组结果,将所述业务交互描述信息映射到所述原始用户访问轨迹信息所在用户行为事件,在所述原始用户访问轨迹信息所在用户行为事件中得到所述业务交互描述信息对应的待处理策略匹配信息,确定与所述待处理策略匹配信息对应的目标用户访问轨迹信息;
获取所述原始用户访问轨迹信息映射到所述目标用户行为事件中的信息映射记录;根据所述待处理策略匹配信息与所述信息映射记录上的多个待匹配事件记录对应的历史策略匹配信息之间的信息关联度,在所述用户行为模拟结果中依次获取所述目标用户访问轨迹信息对应的目标点击事件,直至获取到的所述目标点击事件所在用户行为事件的影响权重与所述目标用户访问轨迹信息在所述页面点击分析结果中的影响权重一致时,停止获取下一用户行为事件中的目标点击事件,并建立所述目标用户访问轨迹信息与最后一次获取到的目标点击事件之间的数据处理关联关系;根据所述数据处理关联关系,调用所述采集策略生成模型的策略生成单元对所述采集策略匹配信息进行信息特征提取,并根据信息特征提取结果生成所述用户数据采集策略。
2.根据权利要求1所述的方法,其特征在于,所述基于所述与业务交互时段相关的业务交互对象得到目标业务交互对象数据,包括:对所述与业务交互时段相关的业务交互对象进行业务交互行为检测,得到业务交互行为所对应的实时业务交互对象数据及所述实时业务交互对象数据的交互对象变化数据;
将所述业务交互行为所对应的实时业务交互对象数据及所述实时业务交互对象数据的交互对象变化数据作为目标业务交互对象数据。
3.根据权利要求1所述的方法,其特征在于,通过所述用户数据采集策略从所述用户业务终端中采集待处理用户数据,包括:
根据所述用户数据采集策略中的数据采集指示信息确定用户数据类别集合,其中,所述用户数据类别集合包括n个用户数据类别,每个用户数据类别具有m个数据类别标签,所述n为大于1的整数,所述m为大于1的整数;
根据所述用户数据类别集合生成热度数据类别集合,其中,所述热度数据类别集合包括n个热度数据类别,每个热度数据类别为对用户数据类别进行筛分后得到的,且所述每个热度数据类别具有m个热度数据类别标签;
针对于目标热度数据类别标签,根据所述热度数据类别集合确定类别标签选用率,其中,所述目标热度数据类别标签属于所述m个热度数据类别标签中的任意一个热度数据类别标签;
针对于所述目标热度数据类别标签,若满足数据热度评价条件,则将所述类别标签选用率对应的所述目标热度数据类别标签作为待筛选类别标签;
重复上述确定所述待筛选类别标签的步骤,直至完成对所述m个热度数据标签的处理;
判断确定出的待筛选类别标签的数量是否超过预设数量;在确定出的待筛选类别标签的数量未超过所述预设数量的前提下,根据所述待筛选类别标签从所述用户业务终端中采集与所述待筛选类别标签对应的待处理用户数据;在确定出的待筛选类别标签的数量超过所述预设数量的前提下,将确定出的待筛选类别标签按照类别标签选用率的由大到小的顺序进行排序,并选取排序靠前的所述预设数量个待筛选类别标签作为待使用类别标签,根据所述待使用类别标签从所述用户业务终端中采集与所述待使用类别标签对应的待处理用户数据;
其中,基于所述用户数据分析策略对所述待处理用户数据进行用户画像分析,得到用户画像分析结果,包括:
根据所述用户数据分析策略中包括用户画像分析指标以及所述待处理用户数据,获取用于进行用户画像特征比较的各用户行为数据特征的数据特征识别度及画像特征比较事项对应的全局特征描述信息的全局特征描述置信度,其中,针对任一用户行为数据特征,该用户行为数据特征的数据特征识别度为该用户行为数据特征能够匹配的局部特征描述信息的局部特征描述置信度;
根据各所述用户行为数据特征的数据特征识别度及所述全局特征描述置信度,为各所述用户行为数据特征分配局部特征描述信息,其中,各所述用户行为数据特征分别分配所述全局特征描述信息的部分局部特征描述信息,且各所述用户行为数据特征分配的局部特征描述信息的信息集合包括所述全局特征描述信息;
根据为各所述用户行为数据特征分配的局部特征描述信息,分别生成各所述用户行为数据特征对应的数据特征匹配指示,其中,针对任一用户行为数据特征,该用户行为数据特征对应的数据特征匹配指示表示分配给该用户行为数据特征的局部特征描述信息;
分别执行各所述用户行为数据特征对应的数据特征匹配指示,以实现为各所述用户行为数据特征分别匹配自身所分配的局部特征描述信息,并基于各所述用户行为数据特征分别将参考画像分析结果的画像分析描述信息与各所述用户行为数据特征自身匹配的局部特征描述信息进行比对,得到所述用户业务终端的用户画像分析结果。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述用户行为数据特征的数据特征识别度及所述全局特征描述置信度,为各所述用户行为数据特征分配局部特征描述信息,包括:
获取各所述用户行为数据特征的用户点击频率,其中,所述用户点击频率表示用户行为数据特征的点击事件关联度;
基于所述全局特征描述置信度、各所述用户行为数据特征的用户点击频率及各所述用户行为数据特征的数据特征识别度,为各所述用户行为数据特征分配局部特征描述信息,其中,针对任一用户行为数据特征,该用户行为数据特征分配的局部特征描述信息的局部特征识别度与该用户行为数据特征的用户点击频率正相关,且该用户行为数据特征分配的局部特征描述信息的局部特征识别度不大于该用户行为数据特征的数据特征识别度。
5.根据权利要求4所述的方法,其特征在于,所述基于所述全局特征描述置信度、各所述用户行为数据特征的用户点击频率及各所述用户行为数据特征的数据特征识别度,为各所述用户行为数据特征分配局部特征描述信息,包括:计算各未分配的用户行为数据特征的用户点击频率的页面点击频率均值,并计算各未分配的用户行为数据特征的用户点击频率与所述页面点击频率均值的比值,分别得到各未分配的用户行为数据特征的点击事件关联度的有效点击事件占比,其中,所述未分配的用户行为数据特征为尚未分配局部特征描述信息的用户行为数据特征;
根据各未分配的用户行为数据特征的点击事件关联度的有效点击事件占比及所述全局特征描述置信度,分别得到各未分配的用户行为数据特征的待分配局部特征识别度,其中,针对任一未分配的用户行为数据特征,该未分配的用户行为数据特征的待分配局部特征识别度与该未分配的用户行为数据特征的点击事件关联度的有效点击事件占比正相关;
若各未分配的用户行为数据特征的待分配局部特征识别度均不大于自身的数据特征识别度,针对任一未分配的用户行为数据特征,在所述全局特征描述信息的未分配的局部特征描述信息中,选取该未分配的用户行为数据特征自身待分配局部特征识别度大小的局部特征描述信息,分配给该未分配的用户行为数据特征,其中,各所述用户行为数据特征分配的局部特征描述信息不存在信息交集;
若存在目标用户行为数据特征,针对任一目标用户行为数据特征,在所述全局特征描述信息的未分配的局部特征描述信息中,选取与该目标用户行为数据特征的数据特征识别度大小匹配的局部特征描述信息,分配给该目标用户行为数据特征,将所述全局特征描述置信度的大小更新为当前全局特征描述信息中未分配的局部特征描述信息的局部特征识别度大小,返回上述步骤计算各未分配的用户行为数据特征的用户点击频率的页面点击频率均值,并计算各未分配的用户行为数据特征的用户点击频率与所述页面点击频率均值的比值,分别得到各未分配的用户行为数据特征的点击事件关联度的有效点击事件占比继续执行,其中,所述目标用户行为数据特征为待分配局部特征识别度大于自身的数据特征识别度的未分配局部特征描述信息的用户行为数据特征。
6.根据权利要求4所述的方法,其特征在于,一个所述用户行为数据特征对应一个数据特征分组,同一数据特征分组中的各用户行为数据特征的用户点击频率及数据特征识别度相同;所述基于所述全局特征描述置信度、各所述用户行为数据特征的用户点击频率及各所述用户行为数据特征的数据特征识别度,为各所述用户行为数据特征分配局部特征描述信息,包括:
计算各未分配的用户行为数据特征的用户点击频率的页面点击频率均值,其中,所述未分配的用户行为数据特征为尚未分配局部特征描述信息的用户行为数据特征;
针对任一未分配数据特征分组,计算该数据特征分组中单个用户行为数据特征的用户点击频率与所述页面点击频率均值的比值,得到该数据特征分组中单个用户行为数据特征的点击事件关联度的有效点击事件占比,其中,所述未分配数据特征分组为尚未分配局部特征描述信息的用户行为数据特征所属数据特征分组;
针对任一未分配数据特征分组,根据该数据特征分组中单个用户行为数据特征的点击事件关联度的有效点击事件占比及所述全局特征描述置信度,得到该数据特征分组中单个用户行为数据特征的待分配局部特征识别度,其中,针对任一用户行为数据特征,该用户行为数据特征的待分配局部特征识别度与该用户行为数据特征的点击事件关联度的有效点击事件占比正相关;
若各未分配数据特征分组对应的待分配局部特征识别度均不大于自身数据特征分组对应的数据特征识别度,针对任一未分配局部特征描述信息的用户行为数据特征,在所述全局特征描述信息的未分配的局部特征描述信息中,选取该用户行为数据特征自身待分配局部特征识别度大小的局部特征描述信息,分配给该用户行为数据特征,其中,各所述用户行为数据特征分配的局部特征描述信息不存在信息交集;
若存在目标数据特征分组,针对任一目标数据特征分组,在所述全局特征描述信息的未分配的局部特征描述信息中,分别为该目标数据特征分组中的各用户行为数据特征选取该目标数据特征分组对应的数据特征识别度大小的局部特征描述信息,分配给该目标数据特征分组中的各用户行为数据特征,将所述全局特征描述置信度的大小更新为当前全局特征描述信息中未分配的局部特征描述信息的局部特征识别度大小,返回上述步骤计算各未分配的用户行为数据特征的用户点击频率的页面点击频率均值继续执行,其中,所述目标数据特征分组为对应的待分配局部特征识别度大于自身对应的数据特征识别度的未分配局部特征描述信息的数据特征分组。
7.一种大数据服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1‑6任一项所述的方法。
8.一种计算机可读信号介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时实现权利要求1‑6任一项所述的方法。
说明书 :
基于大数据和业务分析的用户数据处理方法及服务器
技术领域
背景技术
到了广泛的应用。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品
和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群
体。
流研究方向。
发明内容
确定所述用户业务终端处于业务数据交互状态时,基于所述业务数据分析指令确定用户数
据分析策略;获取与业务交互时段相关的业务交互对象和业务交互类型数据,基于所述与
业务交互时段相关的业务交互对象得到目标业务交互对象数据;基于所述用户数据分析策
略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象数据确定用户数
据采集策略;通过所述用户数据采集策略从所述用户业务终端中采集待处理用户数据,并
基于所述用户数据分析策略对所述待处理用户数据进行用户画像分析,得到用户画像分析
结果。
取计算机程序并运行,以执行第一个方面所述的方法。
数据采集策略。如此,大数据服务器能够基于用户数据采集策略对用户业务终端的用户数
据进行针对性采集,从而过滤掉一些无用的数据,这样一来,在进行用户画像分析时,能够
直接对具有数据分析和挖掘价值的待处理用户数据进行分析,不仅可以提高用户画像的分
析速率,还可以提高用户画像的分析精度,从而提升用户数据的处理效率。可以理解,上述
方法能够将用户数据分析策略以及用户数据采集策略进行结合,从而提高用户画像分析的
智能化程度。
使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被
实现和获得。
附图说明
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他相关的附图。
在附图的各个视图中代表相似的机构。
具体实施方式
处理技术是批量化的且无选择性地对用户业务终端的所有用户数据进行分析,然而针对用
户业务终端的所有用户数据而言,其中可能有一部分数据是与用户行为无关的数据,也就
是说这一部分数据是没有分析和挖掘价值的。而采用常规的用户数据处理技术对这些无用
数据进行处理时,不仅会占用处理资源,降低用户画像的分析速率,还可能引入不少噪声数
据,这样会影响用户画像的分析精度。
些无用的数据,这样一来,在进行用户画像分析时,能够直接对具有数据分析和挖掘价值的
用户数据进行分析,不仅可以提高用户画像的分析速率,还可以提高用户画像的分析精度,
从而提升用户数据的处理效率。
细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例
中的技术特征可以相互组合。
明。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被
描述,没有细节,以避免不必要的模糊本发明的方面。
些形成本申请的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并
不旨在限制本申请的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理
解的是,附图仅用于说明和描述的目的,并不意图限制本发明的范围。应当知晓的是,这些
附图并不依照比例。
或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以
从流程图中删除。
务器100和用户业务终端200。
擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central Processing
Unit,CPU)、专用集成电路(Application‑Specific Integrated Circuit,ASIC)、专用指令
集处理器(Application‑Specific Instruction‑set Processor,ASIP)、图形处理单元
(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字
信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable
Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制
器单元、精简指令集计算机(Reduced Instruction‑Set Computer,RISC)、微处理器等或其
任意组合。
线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广
域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城
域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone Switched
Network,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网
络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入
点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。
Memory,PROM),可擦除只读存储器(Erasable Programmable Read‑Only Memory,EPROM),
电可擦除只读存储器(Electric Erasable Programmable Read‑Only Memory,EEPROM)等。
其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
或其组合实现。
中的大数据服务器100,具体可以包括以下步骤S31‑步骤S35。
令可以是与大数据服务器通信的服务商平台发起的。当然,该业务数据分析指令仅针对用
户业务终端的非隐私性交互业务,例如经过用户业务终端授权的视频观看业务、在线购物
业务、在线论坛业务或政企服务业务等。
以用于表征用户业务终端处于业务交互在线状态或者业务交互活跃状态。不同的业务场景
下,业务数据交互状态可以不同,在视频观看业务场景下,业务数据交互状态可以是用户进
行弹幕输入状态,对于在线购物业务而言,业务数据交互状态可以是用户进行商品查找的
浏览状态或者商品购买的点击状态。用户数据分析策略用于提供对用户数据进行分析的指
导性意见。进一步地,可以通过业务数据分析指令中携带的业务数据分析需求来制定用户
数据分析策略,业务数据分析需求可以包括针对不同类型的用户画像的获取需求,在此不
作一一赘述。
可以是与业务数据交互状态对应的时段,例如用户进行弹幕输入的时段,或者用户进行商
品查找的浏览状态的时段,在此不作限定。业务交互对象可以是与用户业务终端存在业务
交互的其他终端。业务交互类型数据用于表征不同的业务交互类型,如上述提到的视频弹
幕交互、购物交互等。目标业务交互对象数据用于记录业务交互对象的相关特征信息。
含针对不同用户数据的数据分析逻辑算法或者逻辑编程语句,关于底层的逻辑算法以及逻
辑编程语句在此不再进行进一步说明。用户数据采集策略用于指导大数据服务器进行针对
性的用户数据采集,进一步如指导大数据服务器对哪些类型的用户数据进行采集,对哪些
类型的用户数据进行过滤或者丢弃,如此一来,能够在进行用户画像分析之前,预先对用户
数据进行针对性采集,避免引入过多的无用数据而增加用户数据的噪声比例。
像分析结果。例如,待处理用户数据基本都是具有分析价值和挖掘价值的数据,这样一来,
在进行用户画像分析时,能够针对性地对待处理用户数据进行分析,不仅可以提高用户画
像的分析速率,还可以提高用户画像的分析精度,从而提升用户数据的处理效率。
数据,这样可以确定出用户数据采集策略。如此,大数据服务器能够基于用户数据采集策略
对用户业务终端的用户数据进行针对性采集,从而过滤掉一些无用的数据,这样一来,在进
行用户画像分析时,能够直接对具有数据分析和挖掘价值的待处理用户数据进行分析,不
仅可以提高用户画像的分析速率,还可以提高用户画像的分析精度,从而提升用户数据的
处理效率。可以理解,上述方法能够将用户数据分析策略以及用户数据采集策略进行结合,
从而提高用户画像分析的智能化程度。
时段相关的业务交互对象得到目标业务交互对象数据,可以包括以下步骤S331和步骤
S332。
对象变化数据。例如,业务交互行为检测可以通过预先设置的检测线程实现,检测线程的相
关配置为现有技术,在此不作更多说明。
保目标业务交互对象数据的实时性,从而提高用户画像分析的时效性,避免用户画像分析
出现滞后。
集策略,可以通过以下步骤S340实现。
模型中基于所述用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目
标业务交互对象数据确定用户数据采集策略。例如,预设的采集策略生成模型可以是预先
搭建的算法模型,该模型的训练样本和测试样本可以根据之前的用户画像分析记录得到,
在此不作赘述。如此设计,能够基于采集策略生成模型对用户数据采集策略进行确定,从而
确保用户数据采集策略与实际用户行为相匹配。
据确定用户数据采集策略,进一步包括以下步骤S341‑步骤S344所描述的内容。其中,以下
的采集策略生成模型的不同的功能单元可以理解为采集策略生成模型的不同处理层或者
不同处理线程,而这些功能单元的相关功能可以通过参数调节进行适应性调整,在此也不
作更多说明。
成模型的信息处理单元,生成所述分析策略指示信息对应的页面点击分析结果,生成所述
采集策略匹配信息对应的用户行为模拟结果;其中,所述页面点击分析结果和所述用户行
为模拟结果分别包括多个具有不同用户兴趣热度值的用户行为事件。例如,用户兴趣热度
值用于表征用户行为事件中的不同点击事件之间的相关度,用户行为事件中包括多个不同
点击事件。
户行为事件确定为目标用户行为事件;通过所述信息处理单元,将所述原始用户访问轨迹
信息映射到所述目标用户行为事件,在所述目标用户行为事件中得到原始访问轨迹映射信
息,并根据所述原始用户访问轨迹信息、所述原始访问轨迹映射信息,生成所述分析策略指
示信息和所述采集策略匹配信息之间的信息关联标签集。
描述信息映射到所述原始用户访问轨迹信息所在用户行为事件,在所述原始用户访问轨迹
信息所在用户行为事件中得到所述业务交互描述信息对应的待处理策略匹配信息,确定与
所述待处理策略匹配信息对应的目标用户访问轨迹信息。
对应的历史策略匹配信息之间的信息关联度,在所述用户行为模拟结果中依次获取所述目
标用户访问轨迹信息对应的目标点击事件,直至获取到的所述目标点击事件所在用户行为
事件的影响权重与所述目标用户访问轨迹信息在所述页面点击分析结果中的影响权重一
致时,停止获取下一用户行为事件中的目标点击事件,并建立所述目标用户访问轨迹信息
与最后一次获取到的目标点击事件之间的数据处理关联关系;根据所述数据处理关联关
系,调用所述采集策略生成模型的策略生成单元对所述采集策略匹配信息进行信息特征提
取,并根据信息特征提取结果生成所述用户数据采集策略。例如,数据处理关联关系可以用
于记录分析策略指示信息和采集策略匹配信息之间的对应关系,从而实现用户数据分析策
略和用户数据采集策略的深度融合。
析,这样能够考虑用户数据分析策略和用户数据采集策略之间的互相关联性,从而确保通
过用户数据采集策略采集得到的待处理用户数据能够与用户数据分析策略进行高度匹配,
这样可以精准、实时地得到用户画像分析结果。
处理用户数据,进一步可以包括3511‑步骤S3516所描述的内容。
据类别标签,所述n为大于1的整数,所述m为大于1的整数。例如,数据采集指示信息用于指
导所需要采集的用户数据是哪些,用户数据类别可以理解为一级标签,数据类别标签可以
理解为二级标签。
到的,且所述每个热度数据类别具有m个热度数据类别标签。例如,热度数据类别用于表征
较为热门的数据类别,也就是那些具有潜在价值的用户数据对应的类别。
个热度数据类别标签。顾名思义,类别标签选用率用于表征类别标签被选中的概率。
热度评价条件可以根据实际需求进行设计,在此不作限定。
户业务终端中采集与所述待筛选类别标签对应的待处理用户数据;在确定出的待筛选类别
标签的数量超过所述预设数量的前提下,将确定出的待筛选类别标签按照类别标签选用率
的由大到小的顺序进行排序,并选取排序靠前的所述预设数量个待筛选类别标签作为待使
用类别标签,根据所述待使用类别标签从所述用户业务终端中采集与所述待使用类别标签
对应的待处理用户数据。例如,预设数据量可以根据实际情况进行调整,在此不作限定。
别标签精准地从用户业务终端中采集对应的待处理用户数据,确保待处理用户数据是具有
潜在的挖掘和分析价值的,尽可能避免引入过多的噪声数据。
步骤S3521‑步骤S3524。
画像特征比较事项对应的全局特征描述信息的全局特征描述置信度,其中,针对任一用户
行为数据特征,该用户行为数据特征的数据特征识别度为该用户行为数据特征能够匹配的
局部特征描述信息的局部特征描述置信度。例如,用户画像分析指标用于指示用户画像分
析的方向和侧重点。用户行为数据特征可以以特征向量或者其他形式进行表示,在此不作
限定。特征描述可以理解为对特征进行的可视化描述,本领域技术人员在本申请所提供的
内容的基础上结合现有的专利文献或者论坛,能够合理地推导出前后文的相关技术术语的
含义,在此不作更多说明。
特征分别分配所述全局特征描述信息的部分局部特征描述信息,且各所述用户行为数据特
征分配的局部特征描述信息的信息集合包括所述全局特征描述信息。
用户行为数据特征对应的数据特征匹配指示表示分配给该用户行为数据特征的局部特征
描述信息。
行为数据特征分别将参考画像分析结果的画像分析描述信息与各所述用户行为数据特征
自身匹配的局部特征描述信息进行比对,得到所述用户业务终端的用户画像分析结果。例
如,参考画像分析结果是预先配置的,可以根据实际需求进行灵活配置,在此不作更多说
明。
定出的用户画像分析结果能够从实际层面反应用户的实际画像情况。
括以下步骤S35221和步骤S35222。
部特征描述信息,其中,针对任一用户行为数据特征,该用户行为数据特征分配的局部特征
描述信息的局部特征识别度与该用户行为数据特征的用户点击频率正相关,且该用户行为
数据特征分配的局部特征描述信息的局部特征识别度不大于该用户行为数据特征的数据
特征识别度。
行为数据特征分配局部特征描述信息,示例性地可以包括以下步骤a‑步骤d。
别得到各未分配的用户行为数据特征的点击事件关联度的有效点击事件占比,其中,所述
未分配的用户行为数据特征为尚未分配局部特征描述信息的用户行为数据特征。
识别度,其中,针对任一未分配的用户行为数据特征,该未分配的用户行为数据特征的待分
配局部特征识别度与该未分配的用户行为数据特征的点击事件关联度的有效点击事件占
比正相关。
分配的局部特征描述信息中,选取该未分配的用户行为数据特征自身待分配局部特征识别
度大小的局部特征描述信息,分配给该未分配的用户行为数据特征,其中,各所述用户行为
数据特征分配的局部特征描述信息不存在信息交集。
据特征识别度大小匹配的局部特征描述信息,分配给该目标用户行为数据特征,将所述全
局特征描述置信度的大小更新为当前全局特征描述信息中未分配的局部特征描述信息的
局部特征识别度大小,返回上述步骤计算各未分配的用户行为数据特征的用户点击频率的
页面点击频率均值,并计算各未分配的用户行为数据特征的用户点击频率与所述页面点击
频率均值的比值,分别得到各未分配的用户行为数据特征的点击事件关联度的有效点击事
件占比继续执行,其中,所述目标用户行为数据特征为待分配局部特征识别度大于自身的
数据特征识别度的未分配局部特征描述信息的用户行为数据特征。
的点击事件关联度的有效点击事件占比,以上用户点击频率、点击事件关联度以及对应的
有效点击事件占比能够从数值层面上反应各用户行为数据特征之间的关联关系以及对应
的局部特征描述信息之间的关联关系,这样能够确保分配得到的局部特征描述信息之间不
会存在较多的误差和缺失。
为数据特征的用户点击频率及数据特征识别度相同。基于此,在上述步骤S35222的基础上,
所述基于所述全局特征描述置信度、各所述用户行为数据特征的用户点击频率及各所述用
户行为数据特征的数据特征识别度,为各所述用户行为数据特征分配局部特征描述信息,
可以包括以下步骤S11‑步骤S15。
特征。
行为数据特征的点击事件关联度的有效点击事件占比,其中,所述未分配数据特征分组为
尚未分配局部特征描述信息的用户行为数据特征所属数据特征分组。
征分组中单个用户行为数据特征的待分配局部特征识别度,其中,针对任一用户行为数据
特征,该用户行为数据特征的待分配局部特征识别度与该用户行为数据特征的点击事件关
联度的有效点击事件占比正相关。
特征,在所述全局特征描述信息的未分配的局部特征描述信息中,选取该用户行为数据特
征自身待分配局部特征识别度大小的局部特征描述信息,分配给该用户行为数据特征,其
中,各所述用户行为数据特征分配的局部特征描述信息不存在信息交集。
数据特征选取该目标数据特征分组对应的数据特征识别度大小的局部特征描述信息,分配
给该目标数据特征分组中的各用户行为数据特征,将所述全局特征描述置信度的大小更新
为当前全局特征描述信息中未分配的局部特征描述信息的局部特征识别度大小,返回上述
步骤计算各未分配的用户行为数据特征的用户点击频率的页面点击频率均值继续执行,其
中,所述目标数据特征分组为对应的待分配局部特征识别度大于自身对应的数据特征识别
度的未分配局部特征描述信息的数据特征分组。
定。
征自身匹配的局部特征描述信息进行比对,得到所述用户业务终端的用户画像分析结果,
可以包括:基于各所述用户行为数据特征,并行地将所述参考画像分析结果的画像分析描
述信息与各所述用户行为数据特征自身匹配的局部特征描述信息进行比对;当基于任一所
述用户行为数据特征进行比对得到比对时效性权重大于预设时效性权重阈值的目标分析
结果时,结束各所述用户行为数据特征针对所述参考画像分析结果的画像分析描述信息的
比对;通过比对时效性权重大于预设时效性权重阈值的目标分析结果,确定所述参考画像
分析结果的画像分析描述信息的用户画像分析结果。如此,在确定用户画像分析结果时,能
够充分考虑比对时效性权重对用户画像的影响,从而确保用户画像分析结果能够及时地反
应用户的实际情况,从而为服务商提供及时的画像信息指导,便于服务商及时地进行相关
服务产品的推送。
对应的全局特征描述信息的全局特征描述置信度之后,所述方法还包括:计算各所述用户
行为数据特征的数据特征识别度的置信度分析结果,得到第一识别置信度;若所述第一识
别置信度小于所述全局特征描述置信度,在所述全局特征描述信息中删除部分局部特征描
述信息,使得删除后的所述全局特征描述信息的全局特征描述置信度不大于所述第一识别
置信度。
据分析指令,包括:获取所述分析指令上报子线程上报的业务数据分析指令。在步骤S31的
所述获取针对所述用户业务终端的业务数据分析指令之后,还包括:基于所述分析指令上
报子线程上报的业务数据分析指令检测业务处理线程的线程运行标签;当检测到业务处理
线程的线程运行标签的数量变化时,确定所述用户业务终端处于业务数据交互状态。
分析指令,包括:获取所述交互对象识别子线程采集到的所述业务处理线程的当前业务交
互对象。在步骤S31的所述获取针对所述用户业务终端的业务数据分析指令之后,还包括:
基于所述交互对象识别子线程采集到的所述业务处理线程的当前业务交互对象,获取交互
对象标识集;当所述业务处理线程对应的线程运行记录中出现所述交互对象标识集的更新
记录时,确定所述用户业务终端处于业务数据交互状态。
数据分析指令,包括:获取所述交互对象识别子线程采集到的所述用户业务终端的业务处
理线程的当前业务交互对象。在步骤S31的所述获取针对所述用户业务终端的业务数据分
析指令之后,还包括:在所述当前业务交互对象中检测交互状态标识;基于检测结果确定所
述用户业务终端是否处于业务数据交互状态。
下功能模块。
分析,得到用户画像分析结果。
的描述。
指令确定用户数据分析策略;获取与业务交互时段相关的业务交互对象和业务交互类型数
据,基于所述与业务交互时段相关的业务交互对象得到目标业务交互对象数据;基于所述
用户数据分析策略的分析策略指示信息、所述业务交互类型数据及所述目标业务交互对象
数据确定用户数据采集策略;通过所述用户数据采集策略从所述用户业务终端中采集待处
理用户数据,并基于所述用户数据分析策略对所述待处理用户数据进行用户画像分析,得
到用户画像分析结果;将所述用户画像分析结果反馈给服务商平台。
值、系数、权重、指数、因子、置信度等术语,本领域技术人员可以根据前后的逻辑关系进行
推导和确定,这些数值的取值范围可以根据实际情况进行选取,例如0 1,又例如1 10,再例
~ ~
如50 100,在此均不作限定。
~
对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行
合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语
的前缀,例如“第一”、“第二”、“上一个”、“下一个”、“前一个”、“后一个”、“当前”、“历史”、
“最新”、“最佳”、“目标”、“指定”和“实时”等,可以根据前后文进行毫无疑义地推导和确定。
未作解释的技术特征术语的后缀,例如“列表”、“特征”、“序列”、“集合”、“矩阵”、“单元”、
“元素”、“轨迹”和“清单”等,也可以根据前后文进行毫无疑义地推导和确定。
基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、
改进、修正仍属于本申请示范实施例的精神和范围。
此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施
例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某
些特征、结构或特点可以进行适当的组合。
组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、
可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上
硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于
至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计
算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或
传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行
传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。
VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran
2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语
言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机
上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务
器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域
网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或
作为服务使用如软件即服务(SaaS)。
过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说
明的目的,附加的申请专利范围并不仅限于披露的实施例,相反,申请专利范围旨在覆盖所
有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可
以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或
行动装置上安装所描述的系统。
其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及
的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。