一种关联设备的方法和装置转让专利

申请号 : CN201610383463.X

文献号 : CN107454444B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘沛吴坤城余嘉伟刘向东贾思超欧阳佑吴明辉

申请人 : 北京学之途网络科技有限公司

摘要 :

本发明公开了一种关联设备的方法,包括:获取样本用户和非样本用户的智能电视设备收视记录和机顶盒设备收视记录;根据每个样本用户的智能电视设备收视记录与机顶盒设备收视记录的匹配情况确定每个样本用户的智能电视设备与机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;根据非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;选出匹配分超过阈值且最高的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备。本发明能够关联同一用户的智能电视设备和机顶盒设备,从而扩展收视率数据采集的渠道。

权利要求 :

1.一种关联设备的方法,该方法包括:

获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;

根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;

获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;

对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;

其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的。

2.如权利要求1所述的方法,其特征在于:

所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;

所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识。

3.如权利要求2所述的方法,其特征在于:

根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,包括:对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条红外线收视记录的记录准确度w;

根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;

对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;

将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分;

其中,所述时段是对一天中24小时采用等分或不等分的方式划分获得的时间区间,所述第j个时段表示划分后获得的任一时间区间;

所述第i个频道,表示任意一个电视频道。

4.如权利要求3所述的方法,其特征在于:

对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分,包括:对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;

对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;

将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分。

5.如权利要求3所述的方法,其特征在于:

所述根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条红外线收视记录的记录准确度w,包括:对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;

其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2。

6.如权利要求5所述的方法,其特征在于:

根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s,包括:在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij。

7.如权利要求3或4或5或6所述的方法,其特征在于:

根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分r为0。

8.如权利要求3或4或5或6所述的方法,其特征在于:

根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为

0。

9.如权利要求3或4或5或6所述的方法,其特征在于:

根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒设备收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为0;

其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒设备收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;

其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。

10.如权利要求3或4或5或6所述的方法,其特征在于:

根据全部样本用户的匹配分确定设备关联阈值,包括:

将全部样本用户的匹配分的均值或最小值确定为设备关联阈值。

11.一种关联设备的装置,包括:

样本用户数据获取模块,用于获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;

样本用户数据运算模块,用于根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;

非样本用户数据获取模块,用于获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;

设备关联运算模块,用于对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;

其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的。

12.如权利要求11所述的装置,其特征在于:

所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;

所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识。

13.如权利要求12所述的装置,其特征在于:

样本用户数据运算模块,包括:记录准确度计算单元、频道识别度计算单元、第一目标机顶盒设备确定单元、第一记录识别分计算单元、第一设备识别分计算单元和设备关联阈值计算单元;

记录准确度计算单元,用于对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条红外线收视记录的记录准确度w;

频道识别度计算单元,用于根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;

第一目标机顶盒设备确定单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;

第一记录识别分计算单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;

其中,所述时段是对一天中24小时采用等分或不等分的方式划分获得的时间区间,所述第j个时段表示划分后获得的任一时间区间;

所述第i个频道,表示任意一个电视频道;

第一设备识别分计算单元,用于将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分;

设备关联阈值计算单元,用于根据全部样本用户的匹配分确定设备关联阈值。

14.如权利要求13所述的装置,其特征在于:

设备关联运算模块,包括:第二目标机顶盒设备确定单元、第二记录识别分计算单元和第二设备识别分计算单元;

第二目标机顶盒设备确定单元,用于对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;

第二记录识别分计算单元,用于对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;

第二设备识别分计算单元,用于将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分。

15.如权利要求13所述的装置,其特征在于:

记录准确度计算单元,用于对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;

其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2。

16.如权利要求15所述的装置,其特征在于:

频道识别度计算单元,用于在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij。

17.如权利要求13或15或16所述的装置,其特征在于:

第一记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内ij第i个频道的频道识别度s 除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分r为0。

18.如权利要求14所述的装置,其特征在于:

第二记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分r为0。

19.如权利要求13或15或16所述的装置,其特征在于:

第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为0。

20.如权利要求14所述的装置,其特征在于:

第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能ij电视设备对第j个时段内第i个频道的频道识别度s ;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分r为0。

21.如权利要求13或15或16所述的装置,其特征在于:

第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内ij第i个频道的频道识别度s ;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒设备收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为

0;

其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒设备收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;

其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。

22.如权利要求14所述的装置,其特征在于:

第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒设备收视记录,则确定该条智能电视设备心跳日志收视记录的识别分r为

0;

其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒设备收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;

其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。

23.如权利要求13或14或15或16所述的装置,其特征在于:

设备关联阈值计算单元,用于将全部样本用户的匹配分的均值或最小值确定为设备关联阈值。

说明书 :

一种关联设备的方法和装置

技术领域

[0001] 本发明涉及数字电视技术领域,尤其涉及的是一种关联设备的方法和装置。

背景技术

[0002] 电视收视率是指某一时段内收看某电视频道(或某电视节目)的人数(或家户数)占电视观众总人数(或家户数)的百分比。作为“注意力经济”时代的重要量化指标,电视收视率是深入分析电视收视市场的科学基础,是节目制作、编排及调整的重要参考,是节目评估的主要指标,是制定与评估媒介计划、提高广告投放效益的有力工具。
[0003] 现有的收视率数据收集方法主要有两种,一种是日记卡法,需要抽样样本用户填写日记卡。另一种是测量仪法,用测量仪来详细记录样本用户收看电视的情况。由于数字电视的频道多,这两类方法需要安装大量测量仪或抽取大量样本用户才能确保每个节目都能监测到足够的数据,保证计算结果的可靠性,因此随之也带来高昂的成本。
[0004] 还有一种新兴的收视率统计方法是通过机顶盒设备回传用户的收视数据,机顶盒设备在用户使用遥控器换台时可以生成红外线日志,所述红外线日志中记录有收视频道信息和收视时间信息。
[0005] 但是,有些用户在关了电视后,有不关机顶盒设备的习惯,还有些用户开着机顶盒,但是实际上并没有开电视,所以,机顶盒设备收集的数据也可能存在不准确性。

发明内容

[0006] 本发明所要解决的技术问题是提供一种关联设备的方法和装置,能够关联同一用户的智能电视设备和机顶盒设备,从而扩展收视率数据采集的渠道,提高收视率数据采集的准确性。
[0007] 本发明实施例提供了一种关联设备的方法,该方法包括:
[0008] 获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0009] 根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;
[0010] 获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0011] 对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;
[0012] 其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的。
[0013] 可选地,所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;
[0014] 所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识。
[0015] 可选地,根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,包括:
[0016] 对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w;
[0017] 根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;
[0018] 对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0019] 将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分。
[0020] 可选地,对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分,包括:
[0021] 对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;
[0022] 对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0023] 将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分。
[0024] 可选地,所述根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w,包括:
[0025] 对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;
[0026] 其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2。
[0027] 可选地,根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s,包括:
[0028] 在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij。
[0029] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0030] 对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外ij线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分r 为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0。
[0031] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0032] 对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0。
[0033] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0034] 对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为0;
[0035] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0036] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。
[0037] 可选地,根据全部样本用户的匹配分确定设备关联阈值,包括:
[0038] 将全部样本用户的匹配分的均值或最小值确定为设备关联阈值。
[0039] 本发明实施例还提供了一种关联设备的装置,包括:
[0040] 样本用户数据获取模块,用于获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0041] 样本用户数据运算模块,用于根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;
[0042] 非样本用户数据获取模块,用于获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0043] 设备关联运算模块,用于对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;
[0044] 其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的。
[0045] 可选地,所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;
[0046] 所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识。
[0047] 可选地,样本用户数据运算模块,包括:记录准确度计算单元、频道识别度计算单元、第一目标机顶盒设备确定单元、第一记录识别分计算单元、第一设备识别分计算单元和设备关联阈值计算单元;
[0048] 记录准确度计算单元,用于对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w;
[0049] 频道识别度计算单元,用于根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;
[0050] 第一目标机顶盒设备确定单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;
[0051] 第一记录识别分计算单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0052] 第一设备识别分计算单元,用于将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分;
[0053] 设备关联阈值计算单元,用于根据全部样本用户的匹配分确定设备关联阈值。
[0054] 可选地,设备关联运算模块,包括:第二目标机顶盒设备确定单元、第二记录识别分计算单元和第二设备识别分计算单元;
[0055] 第二目标机顶盒设备确定单元,用于对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;
[0056] 第二记录识别分计算单元,用于对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0057] 第二设备识别分计算单元,用于将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分。
[0058] 可选地,记录准确度计算单元,用于对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;
[0059] 其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2。
[0060] 可选地,频道识别度计算单元,用于在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij。
[0061] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备ij对第j个时段内第i个频道的频道识别度s 除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0。
[0062] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0。
[0063] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0。
[0064] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0。
[0065] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第ijj个时段内第i个频道的频道识别度s ;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为0;
[0066] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0067] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。
[0068] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别ij分r 为0;
[0069] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0070] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。
[0071] 可选地,设备关联阈值计算单元,用于将全部样本用户的匹配分的均值或最小值确定为设备关联阈值。
[0072] 与现有技术相比,本发明提供的一种关联设备的方法和装置,通过将智能电视设备收集的收视数据与机顶盒设备收集的收视数据进行匹配,从而为智能电视设备找到属于同一用户的机顶盒设备,对已经关联成功的智能电视设备和机顶盒设备,能够将智能电视设备收集的收视数据作为收视率数据的有益补充,从而扩展收视率数据采集的渠道,提高收视率数据采集的准确性。

附图说明

[0073] 图1为本发明实施例的一种关联设备的方法流程图。
[0074] 图2为本发明实施例的一种关联设备的装置示意图。

具体实施方式

[0075] 为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0076] 随着智能电视设备的发展,智能电视设备可以根据图像识别技术识别台标与内容,从而具备收集用户的收视回路数据(包括收视时间和收视频道信息)的能力。如果将智能电视设备用于收视率统计,可以大大降低收视率统计的成本。但是,由于图像识别技术存在局限性,比如,如果是转播的情况,有可能会有台标重叠的情况,就会导致台标识别出错,使得收视回路数据不准确。
[0077] 机顶盒设备在用户使用遥控器换台时可以生成红外线日志,所述红外线日志中记录有收视频道信息和收视时间信息。但是,有些用户在关了电视后,有不关机顶盒设备的习惯,还有些用户开着机顶盒,但是实际上并没有开电视,所以,机顶盒设备收集的数据也可能存在不准确性。
[0078] 因此,如果能够将智能电视设备和机顶盒设备关联起来,打通二者收集的收视数据,将使得二者收集的数据互为参考,并大大拓展数据源(不再局限于样本数据),从而提高收视率统计的准确性。
[0079] 如图1所示,本发明实施例提供了一种关联设备的方法,该方法包括:
[0080] S110,获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0081] S120,根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;
[0082] S130,获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0083] S140,对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;
[0084] 其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的;
[0085] 所述方法还可以包括下述特点:
[0086] 可选地,所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;
[0087] 所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识;
[0088] 可选地,根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,包括:
[0089] 对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w;
[0090] 根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;
[0091] 对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0092] 将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分;
[0093] 可选地,对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分,包括:
[0094] 对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;
[0095] 对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0096] 将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分;
[0097] 可选地,根据全部样本用户的匹配分确定设备关联阈值,包括:
[0098] 将全部样本用户的匹配分的均值或最小值确定为设备关联阈值;
[0099] 可选地,所述根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w,包括:
[0100] 对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;
[0101] 其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2;
[0102] 可选地,根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s,包括:
[0103] 在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij;
[0104] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0105] 对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0;
[0106] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0107] 对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条ij智能电视设备采集的心跳日志收视记录的识别分r 为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0;
[0108] 可选地,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r,包括:
[0109] 对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为0;
[0110] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0111] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近;
[0112] 如图2所示,本发明实施例提供了一种关联设备的装置,包括:
[0113] 样本用户数据获取模块,用于获取样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0114] 样本用户数据运算模块,用于根据每一个样本用户的智能电视设备采集的收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定每一个样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分,根据全部样本用户的匹配分确定设备关联阈值;
[0115] 非样本用户数据获取模块,用于获取非样本用户的智能电视设备采集的收视记录和机顶盒设备采集的收视记录;
[0116] 设备关联运算模块,用于对任意一个非样本用户的智能电视设备,根据所述非样本用户的智能电视设备采集的收视记录与每个非样本用户的机顶盒设备采集的收视记录的匹配情况确定所述非样本用户的智能电视设备与每个非样本用户的机顶盒设备的匹配分;如果存在n个匹配分超过所述设备关联阈值的机顶盒设备,则从所述n个机顶盒设备中选出匹配分最高的机顶盒设备,将所述选出的机顶盒设备与所述智能电视设备关联为同一个非样本用户的设备;n大于或等于1;
[0117] 其中,样本用户的智能电视设备和机顶盒设备的关联关系是已知的;非样本用户的智能电视设备和机顶盒设备的关联关系是未知的。
[0118] 所述装置还可以包括下述特征:
[0119] 可选地,所述智能电视设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、设备标识;
[0120] 所述机顶盒设备采集的收视记录包括以下信息中的至少一种:频道、收视起始时间、收视结束时间、设备标识。
[0121] 可选地,样本用户数据运算模块,包括:记录准确度计算单元、频道识别度计算单元、第一目标机顶盒设备确定单元、第一记录识别分计算单元、第一设备识别分计算单元和设备关联阈值计算单元;
[0122] 记录准确度计算单元,用于对任意一个样本用户,根据所述样本用户的智能电视设备采集的红外线收视记录与同属该样本用户的机顶盒设备采集的收视记录的匹配情况确定该样本用户的智能电视设备采集的每一条收视记录的记录准确度w;
[0123] 频道识别度计算单元,用于根据全部样本用户的智能电视设备采集的红外线收视记录的记录准确度w确定智能电视设备对每一个时段内的每一个频道的频道识别度s;
[0124] 第一目标机顶盒设备确定单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;
[0125] 第一记录识别分计算单元,用于对任意一个样本用户,将同属该样本用户的机顶盒设备确定为目标机顶盒设备;对所述样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0126] 第一设备识别分计算单元,用于将所述样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述样本用户的智能电视设备与同属该样本用户的机顶盒设备的匹配分;
[0127] 设备关联阈值计算单元,用于根据全部样本用户的匹配分确定设备关联阈值。
[0128] 可选地,设备关联运算模块,包括:第二目标机顶盒设备确定单元、第二记录识别分计算单元和第二设备识别分计算单元;
[0129] 第二目标机顶盒设备确定单元,用于对任意一个非样本用户,将每一个非样本用户的机顶盒设备依次确定为目标机顶盒设备;
[0130] 第二记录识别分计算单元,用于对选定的任意一个目标机顶盒设备,对所述非样本用户的智能电视设备采集的任意一条红外线收视记录或心跳日志收视记录,根据所述红外线收视记录或心跳日志收视记录对应的频道和收视起始时间在目标机顶盒设备的收视记录中寻找匹配的收视记录,根据智能电视设备对第j个时段内的第i个频道的频道识别度以及智能电视设备的红外线收视记录或心跳日志收视记录与目标机顶盒设备的收视记录之间的匹配情况计算该条红外线收视记录或心跳日志收视记录的识别分r;
[0131] 第二设备识别分计算单元,用于将所述非样本用户的全部红外线收视记录和/或心跳日志收视记录的识别分的均值确定为所述非样本用户的智能电视设备与目标机顶盒设备的匹配分。
[0132] 可选地,记录准确度计算单元,用于对任意一条智能电视设备采集的红外线收视记录,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间包含所述智能电视设备红外线收视记录起始时间s1的收视记录,则确定所述记录准确度w=0;
[0133] 其中,智能电视设备红外线收视记录的收视起始时间为s1,机顶盒设备收视记录的收视起始时间为s2,机顶盒设备收视记录的收视结束时间为e2。
[0134] 可选地,频道识别度计算单元,用于在全部样本用户的智能电视设备采集的红外线收视记录中关于第j个时段内第i个频道的记录有M条时,将所述M条红外线收视记录的记录准确度的均值确定为智能电视设备对第j个时段内第i个频道的频道识别度sij。
[0135] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集ij的红外线收视记录的识别分r 为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0。
[0136] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的红外线收视记录,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备采集的红外线收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的红外线收视记录的识别分rij为0。
[0137] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备ij采集的心跳日志收视记录的识别分r 为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0。
[0138] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第一条心跳日志收视记录时,在目标机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果能够找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备ij采集的心跳日志收视记录的识别分r 为智能电视设备对第j个时段内第i个频道的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备采集的心跳日志收视记录的识别分rij为0。
[0139] 可选地,第一记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为0;
[0140] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0141] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。
[0142] 可选地,第二记录识别分计算单元,用于对于任意一条智能电视设备采集的心跳日志收视记录,在该条心跳日志收视记录是换台后的第n条心跳日志收视记录时,n大于1,在目标机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第ijj个时段内第i个频道的频道识别度s ;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为智能电视设备对第j个时段内第i个频道的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分rij为0;
[0143] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0144] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近。
[0145] 可选地,设备关联阈值计算单元,用于将全部样本用户的匹配分的均值或最小值确定为设备关联阈值。
[0146] 示例1
[0147] 本示例提供一种优化收视率数据采集的方法,包括以下步骤:
[0148] S310,统一智能电视设备和机顶盒设备的时间;
[0149] 分别用智能电视设备和机顶盒设备与对应的服务器进行通信,分别获取智能电视设备对应的服务器的标准时间和机顶盒设备对应的服务器的标准时间,然后根据二者之间的时间差将两边回路(智能电视设备、机顶盒设备)收到的数据中的时间对齐。
[0150] 比如,假设智能电视设备比机顶盒设备时间早1分钟,则将所有智能电视数据的时间都加1分钟。
[0151] S320,收集样本用户的数据,通过样本用户智能电视设备ID和机顶盒设备ID确定属于同一用户的收视数据;
[0152] 比如,选取N个样本用户进行专项调研,调研包括下面的内容:家里智能电视设备标识(ID),机顶盒设备标识(ID),每次观看的频道(频道标识和收视时间)。
[0153] 对最近一个月的数据进行标记,将属于同一个用户的智能电视设备收视记录和机顶盒设备收视记录进行关联。
[0154] 比如,假设每隔1小时分成一个时间段,则一共有24个时间段(0:00-1:00,1:00-2:00…),频道有CCTV1,北京卫视,湖南卫视等50个频道。
[0155] S330,对每一个样本用户,根据智能电视设备红外线收视记录和机顶盒设备收视记录的对应情况确定每一条智能电视设备红外线收视记录的记录准确度wi,wi=0或1;
[0156] 对任意一条智能电视设备红外线收视记录,该智能电视设备红外线收视记录的收视起始时间为s1,如果该用户的机顶盒设备收视记录中存在频道相同且收视时间区间([s2,e2])包含智能电视设备红外线收视记录起始时间s1的收视记录,则确定智能电视设备红外线收视记录的记录准确度wi=1;如果该用户的机顶盒设备收视记录中不存在频道相同且收视时间区间([s2,e2])包含智能电视设备红外线收视记录起始时间s1的收视记录,则确定智能电视设备红外线收视记录的记录准确度wi=0;wi可以用下面的公式进行表示:
[0157]
[0158] 其中,红外线日志是指:智能电视设备通过检测遥控器上的红外线遥控,当用户使用遥控器换台时识别频道标识并产生日志,这类日志称为红外线日志。由于硬件等因素限制,如果太过频繁产生日志可能会导致机器变卡顿等问题,所以红外线日志的最小识别间隔为t0,即时间t0内,一个设备最多只能有一条红外线日志。
[0159] 其中,时段是对一天(24小时)进行划分获得的时间区间,划分时可以采用等分的方式或不等分的方式。
[0160] 比如,将一天等分为24个时间段:0:00-1:00,1:00-2:00,…,23:00-24:00;
[0161] 假设智能电视设备在第一收视时段(0:00-1:00)生成3条收视记录,如下表1所示,分别是0:00开始观看的CCTV1,0:06开始观看的湖南卫视,0:08开始观看的CCTV5。机顶盒设备在第一收视时段的收视记录有2条,如下表2所示,分别是0:00~0:06观看的CCTV1,0:06~0:10观看的湖南卫视。
[0162]收视起始时间 0:00 0:06 0:08
频道 CCTV1 湖南卫视 CCTV5
[0163] 表1
[0164]收视时间区间 0:00~0:06 0:06~0:10
频道 CCTV1 湖南卫视
[0165] 表2
[0166] 假设第一个频道是CCTV1,第二个频道是CCTV5,第三个频道是湖南卫视。
[0167] 对于CCTV1在第一时段的记录,智能电视设备的记录是0:00开始,对应的机顶盒设备的记录是:0:00~0:06,智能电视设备记录的开始时间落在机顶盒设备记录的时间区间内,所以该条智能电视设备记录是正确的,也即,w1=1;
[0168] 对于湖南卫视在第一时段的记录,智能电视设备的记录是0:06开始,对应的机顶盒设备的记录是:0:06~0:10,智能电视设备记录的开始时间落在机顶盒设备记录的时间区间内,所以该条智能电视设备记录是正确的,也即,w2=1;
[0169] 对于CCTV5在第一时段的记录,智能电视设备的记录是0:08开始,没有相同频道的机顶盒设备记录,因此,w3=0;
[0170] S340,根据全部样本用户的智能电视设备红外线收视记录的记录准确度确定智能电视设备的频道识别度s;
[0171] 如果全部样本用户的智能电视设备红外线收视记录中关于第i个频道在第j个时段的记录总数为M条,则智能电视设备对第i个频道在第j个时段内的频道识别度sij为全部M条记录对应的记录准确度的平均值,sij用下面的公式表示为:
[0172]
[0173] S350,根据智能电视设备的频道识别度s确定每一条智能电视设备收视记录的识别分;
[0174] 智能电视设备收视记录可以包括:红外线收视记录和心跳日志记录;
[0175] 其中,心跳日志记录是指:智能电视设备每隔固定心跳间隔去识别台标和内容,产生日志记录,这类日志记录称为心跳日志记录;其中,所述心跳间隔记作t1;
[0176] 智能电视设备收视记录的收视起始时间,记作s1;机顶盒设备收视记录的收视起始时间,记作s2,机顶盒设备收视记录的收视结束时间,记作e2;
[0177] (1)根据智能电视设备的频道识别度s确定每一条智能电视设备红外线收视记录的识别分;
[0178] 对于指示第i个频道在第j个时段的第t条记录的智能电视设备红外线记录,在该用户的机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该红外线收视记录收视起始时间s1最接近的收视记录,如果找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于红外线最小识别间隔t0,则确定该条智能电视设备红外线收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij;如果找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于红外线最小识别间隔t0,则确定该条智能电视设备红外线收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备红外线收视记录的识别分 为0;
[0179] 指示第i个频道在第j个时段的第t条记录的智能电视设备红外线记录的识别分可以用公式表示如下:
[0180]
[0181] (2)根据智能电视设备的频道识别度s确定每一条智能电视设备心跳日志收视记录的识别分;
[0182] 对于指示第i个频道在第j个时段的第t条记录的智能电视设备心跳日志记录,如果该条智能电视设备心跳日志记录是换台后的第一条心跳日志记录,则在该用户的机顶盒设备收视记录中寻找频道相同且收视起始时间s2与该心跳日志收视记录收视起始时间s1最接近的收视记录,如果找到频道相同的收视记录且二者的收视起始时间差|s1-s2|小于或等于心跳间隔t1,则确定该条智能电视设备心跳日志收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij;如果找到频道相同的收视记录且二者的收视起始时间差|s1-s2|大于心跳间隔t1,则确定该条智能电视设备心跳日志收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij除以收视起始时间差|s1-s2|的商;如果找不到频道相同的收视记录,则确定该条智能电视设备红外线收视记录的识别分 为0;
[0183] 指示第i个频道在第j个时段的第t条记录的智能电视设备心跳日志记录的识别分可以用公式表示如下:
[0184]
[0185] 对于指示第i个频道在第j个时段的第t条记录的智能电视设备心跳日志记录,如果该条智能电视设备心跳日志记录是换台后的第n条心跳日志记录,n大于1,则在该用户的机顶盒设备收视记录中寻找满足第一条件的收视记录,如果能够找到满足第一条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij;如果不能够找到满足第一条件的收视记录,则在该用户的机顶盒设备收视记录中寻找满足第二条件的收视记录,如果能够找到满足第二条件的收视记录,则确定该条智能电视设备心跳日志收视记录的识别分 为智能电视设备对第i个频道在第j个时段的频道识别度sij除以所述找到的最接近的收视记录与所述智能电视设备心跳日志收视记录的时间差Δt的商;其中,所述时间差Δt为所述最接近的收视记录的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1的时间差;如果找不到频道相同的机顶盒收视记录,则确定该条智能电视设备心跳日志收视记录的识别分 为0;
[0186]
[0187] 其中,所述第一条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且机顶盒收视记录的收视时间区间包含所述智能电视设备心跳日志收视记录的收视起始时间;
[0188] 其中,所述第二条件为:智能电视设备心跳日志收视记录与机顶盒设备收视记录的频道相同,且收视时间区间的收视起始时间s2或收视结束时间e2与该心跳日志收视记录收视起始时间s1最接近;
[0189] S360,根据样本户的全部智能电视设备收视记录的识别分计算该样本户的智能电视设备与机顶盒设备的匹配分;
[0190] 样本户的智能电视设备与机顶盒设备的匹配分是该样本户的全部智能电视设备收视记录的识别分的平均值;
[0191] S370,根据每一户样本户的智能电视设备与机顶盒设备的匹配分确定关联智能电视设备与机顶盒设备收视记录的匹配分阈值;
[0192] 关联智能电视设备与机顶盒设备收视记录的匹配分阈值包括:全部样本户的智能电视设备与机顶盒设备的匹配分的最小值或均值;
[0193] S380,为非样本用户的智能电视设备寻找能够进行关联的机顶盒设备;
[0194] 对任意一个非样本用户的智能电视设备,计算该样本用户的智能电视设备与每一个机顶盒设备的匹配分,如果至少存在一个匹配分超过匹配分阈值的机顶盒设备,则将匹配分最高的机顶盒设备确定为能够与所述智能电视设备进行关联的机顶盒设备;
[0195] 假设智能电视设备A是非样本用户的智能电视设备,判断机顶盒设备B是否能够与智能电视设备A进行关联:
[0196] 智能电视设备的红外线最小识别时间t0为1分钟,心跳间隔t1为2分钟,假设第一个频道是CCTV1,第二个频道是CCTV5,第三个频道是湖南卫视,将一天等分为24个时间段:0:00-1:00,1:00-2:00,…,23:00-24:00;
[0197] 通过样本户数据已经计算出:智能电视设备对CCTV5在第一时段的频道识别度s21=0.9,智能电视设备对湖南卫视在第一时段的频道识别度s31=0.7;
[0198] 智能电视设备A一共产生8条日志(分别记为A1-A8),其中包括2条红外线日志(A1-A2),6条心跳日志(A3-A8),A1-A8分别对应频道识别度S1-S8,其中,S1等于s21,S2等于s31,S3-S7等于s21,S8等于s31;具体数据如下表3所示:
[0199]记录号 频道 收视起始时间 频道识别度s
A1 CCTV5 0:00 S1=0.9
A2 湖南卫视 0:10 S2=0.7
A3 CCTV5 0:00 S3=0.9
A4 CCTV5 0:02 S4=0.9
A5 CCTV5 0:04 S5=0.9
A6 CCTV5 0:06 S6=0.9
A7 CCTV5 0:08 S7=0.9
A8 湖南卫视 0:10 S8=0.7
[0200] 表3
[0201] 机顶盒设备B一共产生2条日志(分别记为B1-B2),具体数据如下表4所示:
[0202]记录号 频道 收视时间区间
B1 CCTV5 0:00~0:06
B2 湖南卫视 0:06~0:10
[0203] 表4
[0204] 接下来要计算智能电视设备A中的每一条记录的识别分r,对应于r1-r8,如下表5所示:
[0205]识别分 数值
r1 0.9
r2 0.175
r3 0.9
r4 0.9
r5 0.9
r6 0.9
r7 0.45
r8 0.175
[0206] 表5
[0207] A1对应的机顶盒日志为B1,因为两者开始时间的差|s2-s1|=0分钟,小于t0,所以r1=S1=0.9;
[0208] A2对应的机顶盒日志为B2,两者之间的开始时间差|s2-s1|=4分钟,大于t0,所以r2=S2/|s1-s2|=0.7/4=0.175;
[0209] A3是换台后的第一个心跳日志,对应的机顶盒日志为B1,两者开始时间差|s2-s1|=0分钟,小于t1,所以r3=S3=0.9;
[0210] A4,A5,A6分别是换台后的第2个、第3个、第4个心跳日志,对应的机顶盒日志均为B1,因为A4,A5,A6日志落在了B1的收视区间内,所以r4=S4=0.9,r5=S5=0.9,r6=S6=0.9;
[0211] A7是换台后的第5个心跳日志,机顶盒日志B1是与A7频道相同,且收视区间的结束时间与A7的收视开始时间最接近的日志,所以:
[0212] r7=S7/|e2-s1|=0.9/2=0.45;
[0213] A8是换台后的第一个心跳日志,对应的机顶盒日志为B2,两者之间的开始时间差|s2-s1|=4分钟,大于t1,所以r8=S8/|s2-s1|=0.7/4=0.175;
[0214] 最后计算智能电视设备A与机顶盒设备B的设备匹配分m:
[0215]
[0216] 假设根据样本户数据得到的智能电视设备与机顶盒设备之间的匹配分阈值为0.6,因为智能电视设备A与机顶盒设备B的设备匹配分高于所述匹配分阈值,因此,确定智能电视设备A与机顶盒设备B是属于同一个用户的,二者能够进行关联。
[0217] S390,如果为非样本用户确定了关联的智能电视设备和机顶盒设备,则可以结合智能电视设备收视记录和机顶盒设备收视记录进行收视率统计;
[0218] 其中,智能电视设备收视记录可以用于修正机顶盒设备收视记录,比如,考虑到用户的电视可能处于关闭状态,而机顶盒处于频道播放工作状态,因此,如果机顶盒收视记录中存在满足下述条件的收视记录,则可以认为该条机顶盒收视记录是无效的,可以剔除,所述条件可以是:该条机顶盒收视记录的收视时间区间内没有所述智能电视的任何频道的收视记录。
[0219] 上述实施例提供的一种关联设备的方法和装置,通过将智能电视设备收集的收视数据与机顶盒设备收集的收视数据进行匹配,从而为智能电视设备找到属于同一用户的机顶盒设备,对已经关联成功的智能电视设备和机顶盒设备,能够将智能电视设备收集的收视数据作为收视率数据的有益补充,从而扩展收视率数据采集的渠道,提高收视率数据采集的准确性。
[0220] 本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
[0221] 需要说明的是,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。