物联网数据的标签化用户画像生成系统及方法转让专利

申请号 : CN202010209582.X

文献号 : CN111538751B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 不公告发明人

申请人 : 重庆特斯联智慧科技股份有限公司

摘要 :

本申请公开了物联网数据的标签化用户画像生成系统,其中,用户组生成模块用于基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组,初始标签建立模块用于建立对象和对象联系的结构化体系,并向对象和对象联系填充物联网数据,从而为该用户组建立初始标签,初始标签泛化模块用于对初始标签进行泛化得到泛化标签,用户组画像生成模块用于基于泛化标签生成用户组画像,进而得到目标用户画像。该系统通过进行用户关系扩展,将包括目标用户在内的具有相似属性、场景、行为的多个用户聚集为一个用户组,并以用户组的画像来作为目标用户的画像,扩大了物联网数据的数据量级,增高了频次。

权利要求 :

1.一种物联网数据的标签化用户画像生成系统,其特征在于,包括:用户组生成模块,用于基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组;

初始标签建立模块,用于建立对象和对象联系的结构化体系,并向所述对象和对象联系填充所述物联网数据,从而为该用户组建立初始标签;

初始标签泛化模块,用于对所述初始标签进行泛化得到泛化标签;

用户组画像生成模块,用于基于所述泛化标签生成用户组画像,进而得到目标用户画像;其中,

所述特征包括属性特征、行为特征和场景特征,所述属性特征是能够反映出用户自然属性的特征,所述行为特征为用户在物联网空间的移动时空轨迹、对环境参数和智能化设备功能的主动调节信息,所述场景特征为用户出入的物联网空间的空间位置、空间类型及利用传感器感知的关于物联网空间的环境参数和智能化设备工作模式参数信息;所述初始标签与所述特征相对应,包括属性标签、行为标签和场景标签;

所述用户组生成模块包括:

关键词提取单元,用于提取用户产生的物联网数据的特征类别,得到类别关键词;

向量生成单元,用于对所述类别关键词进行频次统计,得到用户的特征类别向量;

相似度计算单元,用于对目标用户和非目标用户的所述特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户;

所述相似度计算单元通过以下公式进行所述相似度计算:其中,u1和u2分别为目标用户和非目标用户,u1=(n11,n12,…,n1m),u2=(n21,n22,…,n2m),nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。

2.如权利要求1所述的系统,其特征在于,该系统还包括:用户画像更新模块,用于更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,并基于历史兴趣度通过以下公式对用户画像进行更新:

newinst=(oldinst)×exp(-cool×Texist)其中,newinst为当前兴趣度,oldinst为历史兴趣度,cool为冷却系数,Texist为发生类别关键词指代的特征所发生后距当前时刻的时长。

3.如权利要求1所述的系统,其特征在于,该系统还包括:行为分析模块,用于获取用户组内各用户进行所述特征类别活动的近度、频度和强度,基于所述近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别,并针对不同用户类别预测用户流失率,基于所述用户流失率对不同用户类别的用户实施相应配合用户进行特征类别活动的策略。

4.一种物联网数据的标签化用户画像生成方法,其特征在于,包括:基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组;

建立对象和对象联系的结构化体系,并向所述对象和对象联系填充所述物联网数据,从而为该用户组建立初始标签;

对所述初始标签进行泛化得到泛化标签;

基于所述泛化标签生成用户组画像,进而得到目标用户画像;其中,所述特征包括属性特征、行为特征和场景特征,所述属性特征是能够反映出用户自然属性的特征,所述行为特征为用户在物联网空间的移动时空轨迹、对环境参数和智能化设备功能的主动调节信息,所述场景特征为用户出入的物联网空间的空间位置、空间类型及利用传感器感知的关于物联网空间的环境参数和智能化设备工作模式参数信息;所述初始标签与所述特征相对应,包括属性标签、行为标签和场景标签;

所述基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,包括:

获取用户产生的物联网数据的特征类别,得到类别关键词;

对所述类别关键词进行频次统计,得到用户的特征类别向量;

对目标用户和非目标用户的所述特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户;

通过以下公式进行所述相似度计算:其中,u1和u2分别为目标用户和非目标用户,u1=(n11,n12,…,n1m),u2=(n21,n22,…,n2m),nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。

5.如权利要求4所述的方法,其特征在于,该方法还包括:更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,并基于历史兴趣度通过以下公式对用户画像进行更新:newinst=(oldinst)×exp(-cool×Texist)其中,newinst为当前兴趣度,oldinst为历史兴趣度,cool为冷却系数,Texist为发生类别关键词指代的特征所发生后距当前时刻的时长。

6.如权利要求5所述的方法,其特征在于,该方法还包括:获取用户组内各用户进行所述特征类别活动的近度、频度和强度,基于所述近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别,并针对不同用户类别预测用户流失率,基于所述用户流失率对不同用户类别的用户实施相应配合用户进行特征类别活动的策略。

说明书 :

物联网数据的标签化用户画像生成系统及方法

技术领域

[0001] 本申请涉及用户画像构建技术领域,特别涉及物联网数据的标签化用户画像生成系统及方法。

背景技术

[0002] 用户画像是一个独立的描述用户需求、偏好和兴趣的用户模型,是从海量的系统数据中提取个人数据的信息集合。建立用户画像的过程中,建立标签是不和或缺的一个步
骤。标签是对用户在某个维度下的特征,进行分类性、概况性的描述,标签化的用户画像是
用一系列的、多个维度下的标签实现对用户描述的数据体系。
[0003] 目前,标签的提取以及用户画像的生成,主要是通过互联网平台收集的与用户相关的互联网大数据来实现的,例如用户的消费购买记录、对新闻、文章、广告的浏览记录、多
媒体观看记录乃至输入法的输入词汇记录、在搜索引擎的检索关键词记录等。在大数据基
础上,针对各个维度通过提取、统计和挖掘,获得标签。用户画像可以用于适配该用户的产
品、广告推荐、个性化内容推送等。
[0004] 而随着物联网的普及,在智能写字楼、智慧家庭、智能汽车等现实的物联网空间中的各类传感器、摄像头、智能化设备等不断采集、生成物联网数据,这些物联网数据也与用
户直接关联。利用物联网数据生成标签化的用户画像,可以实现适配该用户的室内环境调
控、设备工作模式设置、附加功能推送等。
[0005] 但是,对于在物联网数据的基础上实现标签化用户画像来说,首先物联网数据的数据量级和累积速率明显更低,用户在物联网空间的行为、场景的频度也低很多,另外物联
网数据的变化可能性空间没有互联网平台的数据那么大,因此用户的潜在属性和兴趣偏好
不容易分析,因此难以通过现有的特征提取和规律挖掘手段来获得准确描述用户特征的标
签。

发明内容

[0006] (一)申请目的
[0007] 基于此,为了针对整个用户组的物联网数据,进行标签化用户画像的生成,解决物联网数据的数据量级小、发生频次低的问题,从而通过标签化的用户画像实现对物联网空
间内的用户特征的描述,本申请公开了以下技术方案。
[0008] (二)技术方案
[0009] 一方面,提供了一种物联网数据的标签化用户画像生成系统,包括:
[0010] 用户组生成模块,用于基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组;
[0011] 初始标签建立模块,用于建立对象和对象联系的结构化体系,并向所述对象和对象联系填充所述物联网数据,从而为该用户组建立初始标签;
[0012] 初始标签泛化模块,用于对所述初始标签进行泛化得到泛化标签;
[0013] 用户组画像生成模块,用于基于所述泛化标签生成用户组画像,进而得到目标用户画像;其中,
[0014] 所述特征包括属性特征、行为特征、场景特征中的至少一项。
[0015] 在一种可能的实施方式中,所述用户组生成模块包括:
[0016] 关键词提取单元,用于提取用户产生的物联网数据的特征类别,得到类别关键词;
[0017] 向量生成单元,用于对所述类别关键词进行频次统计,得到用户的特征类别向量;
[0018] 相似度计算单元,用于对目标用户和非目标用户的所述特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户。
[0019] 在一种可能的实施方式中,所述相似度计算单元通过以下公式进行所述相似度计算:
[0020]
[0021] 其中,u1和u2分别为目标用户和非目标用户,
[0022] u1=(n11,n12,…,n1m),u2=(n21,n22,…,n2m),nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。
[0023] 在一种可能的实施方式中,该系统还包括:
[0024] 用户画像更新模块,用于更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,并基于历史兴趣度通过以下公式对
用户画像进行更新:
[0025] newinst=(oldinst)×exp(-cool×Texist)
[0026] 其中,newinst为当前兴趣度,oldinst为历史兴趣度,cool为冷却系数,Texist为发生类别关键词指代的特征所发生后距当前时刻的时长。
[0027] 在一种可能的实施方式中,该系统还包括:
[0028] 行为分析模块,用于获取用户组内各用户进行所述特征类别活动的近度、频度和强度,基于所述近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别,并针
对不同用户类别预测用户流失率,基于所述用户流失率对不同用户类别的用户实施相应配
合用户进行特征类别活动的策略。
[0029] 另一方面,还提供了一种物联网数据的标签化用户画像生成方法,包括:
[0030] 基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组;
[0031] 建立对象和对象联系的结构化体系,并向所述对象和对象联系填充所述物联网数据,从而为该用户组建立初始标签;
[0032] 对所述初始标签进行泛化得到泛化标签;
[0033] 基于所述泛化标签生成用户组画像,进而得到目标用户画像;其中,
[0034] 所述特征包括属性特征、行为特征、场景特征中的至少一项。
[0035] 在一种可能的实施方式中,所述基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,包括:
[0036] 获取用户产生的物联网数据的特征类别,得到类别关键词;
[0037] 对所述类别关键词进行频次统计,得到用户的特征类别向量;
[0038] 对目标用户和非目标用户的所述特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户。
[0039] 在一种可能的实施方式中,通过以下公式进行所述相似度计算:
[0040]
[0041] 其中,u1和u2分别为目标用户和非目标用户,
[0042] u1=(n11,n12,…,n1m),u2=(n21,n22,…,n2m),nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。
[0043] 在一种可能的实施方式中,该方法还包括:
[0044] 更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,并基于历史兴趣度通过以下公式对用户画像进行更新:
[0045] newinst=(oldinst)×exp(-cool×Texist)
[0046] 其中,newinst为当前兴趣度,oldinst为历史兴趣度,cool为冷却系数,Texist为发生类别关键词指代的特征所发生后距当前时刻的时长。
[0047] 在一种可能的实施方式中,该方法还包括:
[0048] 获取用户组内各用户进行所述特征类别活动的近度、频度和强度,基于所述近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别,并针对不同用户类别预测
用户流失率,基于所述用户流失率对不同用户类别的用户实施相应配合用户进行特征类别
活动的策略。
[0049] (三)有益效果
[0050] 本申请公开的物联网数据的标签化用户画像生成系统及方法,通过进行用户关系扩展,将包括目标用户在内的具有相似属性、场景、行为的多个用户聚集为一个用户组,并
以用户组的画像来作为目标用户的画像,扩大了物联网数据的数据量级,增高了频次,解决
了在基于物联网数据对单一目标用户构建画像时由于物联网数据的产生速率低、发生频率
低、数据分析困难等原因而难以有足够的数据量来生成单一目标用户画像的缺陷。

附图说明

[0051] 以下参考附图描述的实施例是示例性的,旨在用于解释和说明本申请,而不能理解为对本申请的保护范围的限制。
[0052] 图1是本申请公开的标签化用户画像生成系统实施例的结构框图。
[0053] 图2是本申请公开的标签化用户画像生成方法实施例的流程示意图。

具体实施方式

[0054] 为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行更加详细的描述。
[0055] 下面参考图1详细描述本申请公开的物联网数据的标签化用户画像生成系统实施例。如图1所示,本实施例公开的系统主要包括有:用户组生成模块、初始标签建立模块、初
始标签泛化模块和用户组画像生成模块。
[0056] 用户组生成模块用于基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组。
[0057] 用户产生的物联网数据可以包括通过ETC、RFID、GPS、各种传感器寄智能设备获取到的用户组内各用户的日常生活及工作数据,例如对智慧家庭的各家电设备的远程控制产
生的数据、可穿戴设备实时反馈的数据、远程抄表数据等。
[0058] 目标用户是待生成标签化用户画像的用户,首先从目标用户的特征入手,获取到目标用户的物联网数据,以及物联网数据库中储备的若干其他用户的物联网数据。
[0059] 特征能够从物联网数据中反映出用户的特质,特征可以包括属性特征、行为特征和场景特征。由于特征在本质上就是物联网数据,因此物联网数据包含了这些特征的数据
源。
[0060] 属性特征是能够反映出用户自然属性的特征,可以是利用物联网空间中的传感器、摄像头、智能化设备采集的用户的人脸图像、指纹等表明用户身份的信息,进而可以获
得用户的性别、年龄等进一步的信息。
[0061] 行为特征可以是用户在物联网空间的移动时空轨迹、对环境参数和智能化设备功能的主动调节等信息。
[0062] 场景特征可以是用户日常出入的物联网空间的空间位置、空间类型(办公室、会议室、客厅)及利用传感器感知的关于物联网空间的环境参数(温度、亮度)和智能化设备工作
模式参数等信息。
[0063] 针对目标用户的个人属性、日常行为、活动场景等特征,确定出一定数量的与目标用户具有“相似属性”、“相似行为”、“相似场景”等关系的其他用户,并将这些确定出的用户
进行汇聚形成关于目标用户的用户组,用户组内的用户均为与目标用户特征相似的用户。
[0064] 初始标签建立模块用于建立对象和对象联系的结构化体系,并向对象和对象联系填充物联网数据获取模块获取的物联网数据,从而为该用户组建立初始标签。
[0065] 具体的,初始标签建立模块从对象和对象联系的角度来组织、挖掘用户组的物联网数据中在个人属性、日常行为、活动场景的特征,对于用户特征从对象和对象联系的角度
进行投射,形成对用户组有效的对象和对象联系,从而基于对目标用户所属的用户组有效
的对象和对象联系建立初始标签。
[0066] 用户组生成模块是依据物联网数据中的用户特征划分出用户组,这些用户特征数据可以就是建立标签时所基于的数据,例如初始标签的类型按照描述用户的维度可以分为
“属性标签”、“行为标签”、“场景标签”等,分别描述用户的个人属性、日常行为、活动场景等
方面的特征。
[0067] 在用户组生成模块生成用户组时所依据的特征可以完全对应于初始标签建立模块建立的初始标签,也就是说,初始标签建立模块建立的初始标签可以是与上述属性特征、
行为特征、场景特征等用户组生成模块所选用的特征相对应的标签,因此“属性标签”、“行
为标签”、“场景标签”也分别对应于前述属性特征、行为特征、场景特征。
[0068] 属性标签可以包括“黑头发”、“黄头发”、“白种人”、“黄种人”、“男性”、“女性”、“青年”、“老年”等。行为标签可以包括“写字楼办公”、“超市购物”、“上传步数”、“开闭百叶窗”、
“调节温度”、“查看住所监控视频”等。场景标签可以包括“26度恒温”、“暗光线”、“安静环
境”等。
[0069] 建立标签时,可以通过机器学习算法抽取用户特征,例如决策树、逻辑回归、支持向量机、贝叶斯网络、K均值算法、主题模型等算法。
[0070] 初始标签按照生成过程可以分为基础标签和知识标签。基础标签是通过直接获取或者简单的统计获取的用户标签,例如用户的性别、年龄、职业等可以从用户的注册信息中
直接获取,用户的购买次数、活跃天数等可以通过数据收集和概率统计而直接获得。知识标
签是利用机器学习、自然语言理解等技术,对于用户相关的大数据进行分类、聚类、回归分
析等特征提取与规律挖掘所获得的标签,是比基础标签更为深层次的标签。
[0071] 初始标签泛化模块用于对初始标签进行泛化得到泛化标签。
[0072] 标签泛化能够将多个标签归纳为一个更为概括的标签,以解决标签粒度过细、类型过杂的问题,将标签体系简化,有利于后续对用户画像的应用。
[0073] 用户组画像生成模块用于基于泛化标签生成用户组画像,将多个维度、不同层级的标签结合起来得到目标用户画像。
[0074] 通过进行用户关系扩展,将包括目标用户在内的具有相似属性、场景、行为的多个用户聚集为一个用户组,并以用户组的画像来作为目标用户的画像,扩大了物联网数据的
数据量级,增高了频次,解决了在基于物联网数据对单一目标用户构建画像时由于物联网
数据的产生速率低、发生频率低、数据分析困难等原因而难以有足够的数据量来生成单一
目标用户画像的缺陷。
[0075] 在一种实施方式中,用户组生成模块包括:关键词提取单元、向量生成单元和相似度计算单元。
[0076] 关键词提取单元用于提取用户产生的物联网数据的特征类别,得到类别关键词。
[0077] 类别关键词将物联网数据进行进一步细分。以行为特征为例,关键词提取单元能够识别出产生特征数据的相应行为动作,例如识别出工作日早上8点至9点期间去往某一栋
写字楼为“上班”行为,工作日晚上6点之后去往某几个特定区域为“购物”行为,晚上9点之
后去往某几个特定区域为“散步”行为,控制空调吹冷风为“降温”行为,遥控电视转到某几
个体育频道为“看体育比赛”行为。其中,“上班”、“购物”、“散步”、“降温”、“看体育比赛”为
类别关键词。
[0078] 关键词提取单元将用户产生的关于行为特征的物联网数据进行详细划分,而这些类别关键词则代表了用户的在行为上的偏好。
[0079] 向量生成单元用于对类别关键词进行频次统计,得到用户的特征类别向量。
[0080] 在关键词提取单元为物联网数据进行了归类划分之后,每个物联网数据均有了自己的类属,继续以行为特征为例,同一类属的物联网数据的数量就代表了用户进行该行为
的频次,而向量生成单元对各种类属进行词频统计,例如某用户产生了100个“上班”行为的
物联网数据,则该100个物联网数据均被关键词提取单元判断为属于“上班”类别关键词,向
量生成单元则统计出存在100个属于“上班”类别关键词的物联网数据。
[0081] 特征类别向量是记录有用户的所有特征类别的发生频次的向量,例如用户的类别A的频次为100,类别B的频次为50,则只包含类别A和类别B的该用户的向量={100,50}。
[0082] 相似度计算单元用于对目标用户和非目标用户的特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户。
[0083] 在判断两个用户的相似度时,基于这两个用户的特征类别向量来进行相似度计算,得到一个相似度值,若该值满足要求,则说明这两个用户的特征(属性特征、行为特征、
场景特征)是相似的,这两个用户是相似用户,可以归入同一用户组。
[0084] 相似度计算单元可以通过以下公式进行相似度计算:
[0085]
[0086] 其中,u1和u2分别为目标用户和非目标用户,
[0087] u1={n11,n12,…,n1m},u2={n21,n22,…,n2m},nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。
[0088] 例如物联网数据库中包括目标用户的行为特征数据和场景特征数据,则基于行为特征和场景特征对数据库内其他用户进行与目标用户之间的相似度计算,其中关键词提取
单元识别出目标用户的行为特征数据有3类,场景特征数据有4类,则目标用户u1={n11,
n12,…,n17},其与其中一个非目标用户u2={n21,n22,…,n27}之间的相似度计算即通过上述
公式进行,算出相似度值sim(u1,u2)。
[0089] 在目标用户与P个非目标用户的相似度计算后,得到P个计算结果。在形成目标用户的用户组时,可以设定一个相似度区间,只有算出的相似度值落入相似度区间内的非目
标用户才被视为目标用户的相似用户;或者可以将相似度值按照进行排序,将与目标用户
最相似的前a个非目标用户作为目标用户的相似用户。
[0090] 可以理解的是,相似度计算单元也可以采用多维标度法等其他方式来进行相似度计算和判断。
[0091] 在一种实施方式中,该系统还包括:用户画像更新模块,用于更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,
并基于历史兴趣度通过以下公式对用户画像进行更新:
[0092] newinst=(oldinst)×exp(-cool×Texist)
[0093] 其中,newinst为当前兴趣度,能够用于更新画像。oldinst为历史兴趣度,历史兴趣度是指目标用户之前对类别关键词所指代的行为特征/场景特征的关注度。cool为冷却系数,
其随时间流逝而逐渐冷却,系数值为系统设定值,系数值不同则冷却速度也不同,使得用户
对相应行为特征/场景特征的兴趣度逐渐降低。Texist为发生类别关键词指代的特征所发生
后距当前时刻的时长,可以以小时、天数等作为衡量标准进行计算。
[0094] 通过对目标用户的所有类别关键词进行兴趣度更新,使得用户标签能够体现出目标用户当前的兴趣度和热度的所在,进而实现用户画像的动态更新。
[0095] 在一种实施方式中,该系统还包括:行为分析模块,用于获取用户组内各用户进行特征类别活动的近度、频度和强度。
[0096] 近度为用户最近一次进行特征类别活动时间距当前时刻的时长,以用户通过随身佩戴的记步设备在跑步时记录里程、步数、心跳、跑步时间等各项数据为例,近度为最近一
次上传跑步里程的时间距离当前时刻的时间跨度。频度为用户在观测时间内进行特征类别
活动的频度,例如用户在最近一段时间内跑步并上传跑步里程的次数。强度为用户在观测
时间内的进行所述特征类别活动的总时长与总天数之比,例如用户在最近一段时间内跑步
的时长与该段时间的总天数之比。
[0097] 之后,行为分析模块基于近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别。聚类分析可以使用K-means聚类算法,在某一行为特征/场景特征方面将用户
分为多个类别。例如,用户类别A:几乎每天都短距离跑步并上传步数的用户;用户类别B:之
前一段时间内每天都跑步并上传步数但最近一段时间没有跑步并上传步数的用户;用户类
别C:每次跑步时间很长但相邻两次跑步之间会间隔几天的用户等。可以理解的是,聚类时
使用的近度、频度和强度数据是经过标准化以后的数值,以消除量纲的影响,并且将近度标
准化后的值进行取反运算,以使近度、频度和强度数据同向变化。
[0098] 然后,行为分析模块针对不同用户类别预测用户的未来流失率。对于用户类别A会被判定为流失率较低,对于用户类别B会被判定为流失率较高,对于用户类别C会被判定为
流失率中等。
[0099] 最后,行为分析模块针基于用户流失率对不同用户类别的用户实施相应配合用户进行特征类别活动的策略。在上述跑步的举例中,用户在跑步时记录步数、跑步时间等参数
并进行上传的活动就是用户进行特征类别活动,而实施相应配合用户进行活动的策略则可
以是向用户提供跑步建议,例如对用户类别A的用户告知用户短跑的注意事项;对用户类别
B的用户告知用户长跑的注意事项以及加强频次的短跑相对于每隔几天一次的长跑有何优
势,以促进用户增加对设备的使用频次;对用户类别C的用户则定期发送跑步锻炼的益处及
注意事项。
[0100] 下面参考图2详细描述本申请公开的物联网数据的标签化用户画像生成方法实施例。本实施例用于实施前述的标签化用户画像生成系统实施例。如图2所示,本实施例公开
的方法包括如下步骤:
[0101] 步骤100,基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,形成目标用户的用户组;
[0102] 步骤200,建立对象和对象联系的结构化体系,并向对象和对象联系填充物联网数据,从而为该用户组建立初始标签;
[0103] 步骤300,对初始标签进行泛化得到泛化标签;
[0104] 步骤400,基于泛化标签生成用户组画像,进而得到目标用户画像;其中,特征包括属性特征、行为特征、场景特征中的至少一项。
[0105] 在一种实施方式中,基于用户产生的物联网数据确定出具有的特征与目标用户的特征相似的其他用户,包括:
[0106] 获取用户产生的物联网数据的特征类别,得到类别关键词;
[0107] 对类别关键词进行频次统计,得到用户的特征类别向量;
[0108] 对目标用户和非目标用户的特征类别向量进行相似度计算,将相似度满足要求的非目标用户作为与目标用户的特征相似的其他用户。
[0109] 在一种实施方式中,通过以下公式进行相似度计算:
[0110]
[0111] 其中,u1和u2分别为目标用户和非目标用户,
[0112] u1=(n11,n12,…,n1m),u2=(n21,n22,…,n2m),nij为第i个用户的第j类类别关键词的词频,m为类别关键词的种类数量。
[0113] 在一种实施方式中,该方法还包括:
[0114] 更新目标用户的特征类别向量,基于更新后的目标用户特征类别计算目标用户对各类别关键词的历史兴趣度,并基于历史兴趣度通过以下公式对用户画像进行更新:
[0115] newinst=(oldinst)×exp(-cool×Texist)
[0116] 其中,newinst为当前兴趣度,oldinst为历史兴趣度,cool为冷却系数,Texist为发生类别关键词指代的特征所发生后距当前时刻的时长。
[0117] 在一种实施方式中,该方法还包括:
[0118] 获取用户组内各用户进行特征类别活动的近度、频度和强度,基于近度、频度和强度对用户组内的各用户进行聚类分析,得到用户类别,并针对不同用户类别预测用户流失
率,基于用户流失率对不同用户类别的用户实施相应配合用户进行特征类别活动的策略。
[0119] 本文中的模块、单元的划分仅仅是一种逻辑功能的划分,在实际实现时可以有其他的划分方式,例如多个模块和/或单元可以结合或集成于另一个系统中。作为分离部件说
明的模块、单元在物理上可以是分开的,也可以是不分开的。作为单元显示的部件可以是物
理单元,也可以不是物理单元,即可以位于一个具体地方,也可以分布到网格单元中。因此
可以根据实际需要选择其中的部分或全部的单元来实现实施例的方案。
[0120] 以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应
涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为
准。