用于对无线热点和POI进行匹配的方法和装置转让专利

申请号 : CN201610641407.1

文献号 : CN106303955B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 汪天一李超吴海山

申请人 : 百度在线网络技术(北京)有限公司

摘要 :

本发明的目的是提供一种用于对无线热点和POI进行匹配的方法和装置。根据本发明的方法包括以下步骤:基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息;根据所述位置信息,获取该无线热点附近的一个或多个候选POI;基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI,其中,所述特征信息包括到访特征信息。与现有技术相比,本发明具有以下优点:基于用户扫描无线热点的相关数据得到与无线热点相匹配的POI,来预测用户实际到访过的POI,而无需人工采集数据或用户反馈的过程,提升了效率。

权利要求 :

1.一种用于对无线热点和POI进行匹配的方法,其中,所述方法包括以下步骤:-基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息;

-根据所述位置信息,获取该无线热点附近的一个或多个候选POI;

-基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI,其中,所述特征信息包括到访特征信息,所述到访特征信息用于指示预定时段内用户扫描无线热点或搜索POI的总次数和总人次;

其中,所述特征信息包括作为排序模型的输入参数的参数特征信息,所述基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的步骤包括以下步骤:-基于排序模型,并基于一项或多项参数特征信息计算所述无线热点和所述各个候选POI的匹配程度信息;

-基于所述匹配程度信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI。

2.根据权利要求1所述的方法,其中,所述方法包括以下步骤:-获取对应于多个无线热点和其附近的候选POI的特征训练信息;

-基于所述特征训练信息训练所述排序模型。

3.根据权利要求1或2所述的方法,其中,所述参数特征信息包括:-无线热点的到访特征信息;

-各个候选POI的到访特征信息;

-无线热点和各个候选POI的相关性特征信息。

4.根据权利要求1所述的方法,其中,所述基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的步骤包括以下步骤:-对热点扫描信息进行预处理,以去除与移动热点相关的数据;

-基于预处理后的热点扫描信息,确定用户所在的无线热点的位置信息。

5.根据权利要求4所述的方法,其中,当用户通过用户设备扫描某个无线热点并产生与该无线热点对应的多个定位点时,所述基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的步骤包括以下步骤:-基于该无线热点的各个定位点的位置信息计算平均位置,作为该无线热点的位置信息。

6.根据权利要求1所述的方法,其中,所述根据所述位置信息,获取该无线热点附近的一个或多个候选POI的步骤包括以下步骤:-基于无线热点的位置信息,获取距离该位置预定范围内的一个或多个POI作为候选POI。

7.一种用于对无线热点和POI进行匹配的匹配装置,其中,所述匹配装置包括:用于基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的装置;

用于根据所述位置信息,获取该无线热点附近的一个或多个候选POI的装置;

用于基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置,其中,所述特征信息包括到访特征信息,所述到访特征信息用于指示预定时段内用户扫描无线热点或搜索POI的总次数和总人次;

其中,所述特征信息包括作为排序模型的输入参数的参数特征信息,所述用于基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置包括:用于基于排序模型,并基于一项或多项参数特征信息计算所述无线热点和所述各个候选POI的匹配程度信息的装置;

用于基于所述匹配程度信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置。

8.根据权利要求7所述的匹配装置,其中,所述匹配装置包括:用于获取对应于多个无线热点和其附近的候选POI的特征训练信息的装置;

用于基于所述特征训练信息训练所述排序模型的装置。

9.根据权利要求7或8所述的匹配装置,其中,所述参数特征信息包括:-无线热点的到访特征信息;

-各个候选POI的到访特征信息;

-无线热点和各个候选POI的相关性特征信息。

10.根据权利要求7所述的匹配装置,其中,所述用于基于用户已扫描的各个无线热点的热点扫描信息,获取用户所在的无线热点的位置信息的装置包括:用于对热点扫描信息进行预处理,以去除与移动热点相关的数据的装置;

用于基于预处理后的热点扫描信息,确定用户所在的无线热点的位置信息的装置。

11.根据权利要求10所述的匹配装置,其中,当用户通过用户设备扫描某个无线热点并产生与该无线热点对应的多个定位点时,所述用于基于用户已扫描的各个无线热点的热点扫描信息,获取用户所在的无线热点的位置信息的装置用于:-基于该无线热点的各个定位点的位置信息计算平均位置,作为该无线热点的位置信息。

12.根据权利要求7所述的匹配装置,其中,所述用于根据所述位置信息,获取该无线热点附近的一个或多个候选POI的装置包括:用于基于无线热点的位置信息,基于无线热点的位置信息,获取距离该位置预定范围内的一个或多个POI作为候选POI的装置。

说明书 :

用于对无线热点和POI进行匹配的方法和装置

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种用于对无线热点和POI进行匹配的方法和装置。

背景技术

[0002] 随着移动互联网和移动智能设备和终端的不断发展,无线热点成为了个人、家庭、企业、餐饮、酒店、零售等服务行业必备的设施和服务之一。无线热点一般可以覆盖室内50米左右的距离,若用户扫描或者连接无线热点,可认为该用户到访了此无线热点所在的兴趣点(Point Of Interest,POI)。因此,根据用户扫描或者连接的无线热点信息以及无线热点与poi的匹配关系,可以推断出用户线下到访的POI。
[0003] 现有技术的方案中,计算和采集无线热点与POI匹配关系的方式主要有以下三种:
[0004] 1)公司企业雇佣专人进行采集。公司企业可以雇佣专门人员,提供设备和培训,采集无线热点和POI的匹配信息;
[0005] 2)利用用户上传数据采集。即鼓励用户在连接无线热点的同时签到自己所在的POI,进而获取无线热点与POI的匹配关系。
[0006] 3)根据无线热点的ssid与周围的POI名称进行匹配。
[0007] 然而上述方式均存在各自的缺陷:
[0008] 1)公司企业雇佣专人采集方式;该方法主要缺点是效率低,成本高。一方面雇佣采集人员的数目有限,采集信息的速度和效率不高,覆盖主要城市和商圈也需要较长时间才能采集完成;另一方面,雇佣专门人员、提供设备、户外采集等都有较高的成本,代价较大。
[0009] 2)用户上传采集的方式。基于众包的思想,该方法采集数据的效率高于直接雇佣专业采集人员,但是采集数据的准确率较难控制。
[0010] 3)根据无线热点的ssid与周围的poi名称进行匹配。该方法匹配的准确率较高,但是覆盖较低。因为不是所有的poi设置无线热点的ssid都与poi名称有直接的相关性。

发明内容

[0011] 本发明的目的是提供一种用于对无线热点和POI进行匹配的方法和装置。
[0012] 根据本发明的一个方面,提供了一种用于对无线热点和POI进行匹配的方法,其中,所述方法包括以下步骤:
[0013] -基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息;
[0014] -根据所述位置信息,获取该无线热点附近的一个或多个候选POI;
[0015] -基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI,其中,所述特征信息包括到访特征信息。
[0016] 根据本发明的一个方面,还提供了一种用于对无线热点和POI进行匹配的匹配装置,其中,所述匹配装置包括:
[0017] 用于基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的装置;
[0018] 用于根据所述位置信息,获取该无线热点附近的一个或多个候选POI的装置;
[0019] 用于基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置,其中,所述特征信息包括到访特征信息。
[0020] 与现有技术相比,本发明具有以下优点:基于用户扫描无线热点的相关数据得到与无线热点相匹配的POI,来预测用户实际到访过的POI,而无需人工采集数据或用户反馈的过程,提升了效率;并且,基于无线热点和POI的到访特征信息来确定相匹配的POI,提升了匹配结果的准确性。

附图说明

[0021] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0022] 图1示意出了根据本发明的一种用于对无线热点和POI进行匹配的方法流程图;
[0023] 图2示意出了根据本发明的一种用于对无线热点和POI进行匹配的匹配装置的结构示意图。
[0024] 附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

[0025] 下面结合附图对本发明作进一步详细描述。
[0026] 图1示意出了根据本发明的一种用于对无线热点和POI进行匹配的方法流程图。根据本发明的方法包括步骤S1、步骤S2和步骤S3。
[0027] 其中,根据本发明的方法通过包含于计算机设备中的匹配装置来实现。所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述计算机设备包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备等方式进行人机交互的电子产品,例如,平板电脑、智能手机、PDA、游戏机等。
[0028] 优选地,所述用于设备包括诸如智能手机等移动终端。
[0029] 优选地,所述用户设备可扫描附近的无线网络(WiFi)。
[0030] 需要说明的是,所述用户设备、网络设备以及网络仅为举例,其他现有的或今后可能出现的用户设备、网络设备以及网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0031] 参照图1,在步骤S1中,匹配装置基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息。
[0032] 其中,所述热点扫描信息包括所述无线热点的位置信息。优选地,所述热点扫描信息还可包括无线热点的名称和信号强度等信息。
[0033] 其中,所述位置信息包括各种可用于表示地理位置的信息。优选地,所述位置信息包括位置坐标信息。
[0034] 具体地,对于已扫描的每个无线热点,匹配装置可直接通过对该无线热点进行定位来得到其对应的位置信息。
[0035] 优选地,匹配装置先对热点扫描信息进行预处理,以去除与移动热点相关的数据。接着,匹配装置基于预处理后的热点扫描信息,确定用户所在的无线热点的位置信息。
[0036] 例如,匹配装置通过计算某无线热点的所有有效定位点与平均定位点距离的方差,当方差高于500米时,认为是移动热点,并予以去除。
[0037] 优选地,匹配装置可将用户已连接的无线热点作为用户所在的无线热点,并获取其位置信息。
[0038] 需要说明的是,用户通过用户设备扫描某个无线热点时可能会由于所处位置的不同而产生与该无线热点对应的多个定位点,
[0039] 优选地,当用户通过用户设备扫描某个无线热点并产生与该无线热点对应的多个定位点时,匹配装置基于该无线热点的各个定位点的位置信息计算平均位置,作为该无线热点的位置信息。
[0040] 优选地,匹配装置可基于各个多个定位点的信号强度,从所述多个定位点中选择一个或多个作为有效定位点,并基于各个有效定位点的位置信息计算平均位置,作为该无线热点的位置信息。
[0041] 根据本发明的第一示例,匹配装置包含于提供在线广告推送服务的网站的服务器中。用户通过智能手机扫描附近的无线热点并扫描到无线热点wifi_1,则匹配装置得到来自该智能手机的、对应于无线热点wifi_1的无线热点信息包括:无线热点wifi_1对应的多个定位点的位置信息和信号强度信息。第一获取装置1选取信号强度高于-80dBm的定位点作为有效定位点,接着基于该多个有效定位点的经纬度坐标信息,计算得到平均位置坐标信息location_1,作为该无线热点wifi_1的位置信息。
[0042] 需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的实现方式,均应包含在本发明的范围内。
[0043] 接着,在步骤S2中,匹配装置根据所述位置信息,获取该无线热点附近的一个或多个候选POI。
[0044] 具体地,匹配装置基于无线热点的位置信息,获取距离该位置预定范围内的一个或多个POI作为候选POI。其中,匹配装置从地图数据中获取各个POI的位置信息,并计算其各自与该位置信息的距离。
[0045] 继续对前述第一示例进行说明,匹配装置根据位置坐标信息location_1,将距离该位置300米内的各个POI作为候选POI。
[0046] 接着,在步骤S3中,匹配装置基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI。
[0047] 其中,所述特征信息包括到访特征信息。所述到访特征信息用于指示预定时段内用户扫描无线热点或搜索POI的总次数和总人次。
[0048] 优选地,到访特征信息包括经统计得到的预定时间段内的用户到访的概率分布信息。例如,过去一天每小时用户扫描无线热点或搜索POI的总次数的概率分布信息。
[0049] 优选地,所述特征信息还可包括可用于指示无线热点或POI的特征属性的信息,例如,“购物”、“美食”或“酒店”等POI的类别特征信息。
[0050] 其中,匹配装置可通过获取多个用户扫描该无线热点的历史扫描数据来得到其到访特征信息,并通过获取多个用户搜索各个POI的历史搜索数据,来得到其特征信息。
[0051] 具体地,匹配装置可直接基于计算的特征信息来确定无线热点分别和各个候选POI的相似度信息,并基于相似度信息来对各个候选POI进行排序。
[0052] 例如,匹配装置将过去一小时用户扫描无线热点的总人次,和分别搜索各个候选POI的总人次,并分别计基于二者的差值来确定该无线热点和各个候选POI的相似度信息,使得差值越小相似度越高,并基于相似度来对各个候选POI进行排序。
[0053] 根据本发明的一个优选实施例,特征信息包括作为排序模型的输入参数的参数特征信息,所述步骤S3包括步骤S301(图未示)和步骤S302(图未示)。
[0054] 在步骤S301中,匹配装置基于所述排序模型,并基于对应于所述无线热点和所述各个候选POI的一项或多项特征信息,计算所述无线热点和所述各个候选POI的匹配程度信息。
[0055] 其中,所述排序模型包括各种基于机器学习方法建立的、可用于预估无线热点和多个POI的匹配程度并对各个POI进行排序的模型。
[0056] 优选地,匹配装置采用基于学习排序方法(learn-to-rank)的得到的排序模型来计算所述无线热点和所述各个候选POI的匹配程度信息。
[0057] 优选地,匹配装置可采用基于LambdaMART算法得到排序模型。
[0058] 其中,作为所述排序模型的输入参数的参数特征信息包括但不限于以下至少任一项信息:
[0059] 1)无线热点的到访特征信息;
[0060] 2)各个候选POI的到访特征信息;
[0061] 3)无线热点和各个候选POI的相关性特征信息;优选地,所述相关性特征信息包括:
[0062] i)无线热点与poi的距离;
[0063] ii)无线热点与poi到访特征信息的向量;例如,时用户扫描无线热点或搜索POI的总次数的概率分布信息的内积。
[0064] iii)无线热点与poi对应的用户到访的总次数和总人次的比值。
[0065] 接着,在步骤S302中,匹配装置基于所述匹配程度信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI。
[0066] 继续对前述第一示例进行说明,匹配装置采用基于LambdaMART算法得到的排序模型model_1。匹配装置多个用户扫描该无线热点wifi_1的历史扫描数据得到其到访特征信息包括:过去一周内每一天24小时的用户扫描的总次数和总人次的概率分布信息pro_1,并通过获取多个用户搜索各个POI的历史搜索数据得到其到访特征信息包括:过去一周内每一天24小时的用户搜索各个候选POI的总次数和总人次的概率分布信息pro_2。
[0067] 则匹配装置得到以下参数特征信息作为排序模型model_1的输入参数:无线热点wifi_1对应的概率分布信息pro_1;各个候选POI对应的概率分布信息pro_2;概率分布信息pro_1和概率分布信息pro_2的内积;无线热点wifi_1与各个候选POI对应的用户到访的总次数和总人次的比值。
[0068] 接着,匹配装置基于上述参数特征信息,计算所述无线热点wifi_1和各个候选POI的匹配程度信息,并对各个候选POI进行排序,并将排名第一位的候选POI作为与该无线热点wifi_1相匹配的POI。
[0069] 需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何匹配装置基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的实现方式,均应包含在本发明的范围内。
[0070] 优选地,通过执行步骤S4(图未示)和步骤S5(图未示)来训练所述排序模型。
[0071] 在步骤S4中,匹配装置获取对应于多个无线热点和其附近的候选POI的特征训练信息。
[0072] 优选地,匹配装置可基于所述无线热点的名称信息分别与各个POI的名称信息的编辑距离,从所述预定范围内的各个POI中选择一个或多个作为候选POI。
[0073] 在步骤S5中,匹配装置基于所述特征训练信息训练所述排序模型。
[0074] 匹配装置可多次执行所述步骤S4和步骤S5来训练所述排序模型,并基于预定的方法来评估所训练的排序模型的准确率。例如,可构造一批验证数据。将验证数据输入到排序模型中,并统计排序结果的准确率。
[0075] 根据本发明的方法,基于用户扫描无线热点的相关数据得到与无线热点相匹配的POI,来预测用户实际到访过的POI,而无需人工采集数据或用户反馈的过程,提升了效率;并且,根据本发明的方法,基于无线热点和POI的到访特征信息来确定相匹配的POI,提升了匹配结果的准确性。
[0076] 图2示意出了根据本发明的一种用于对无线热点和POI进行匹配的匹配装置的结构示意图。
[0077] 根据本发明的匹配装置包括:用于基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的装置(以下简称“第一获取装置1”);用于根据所述位置信息,获取该无线热点附近的一个或多个候选POI的装置(以下简称“第二获取装置2”);用于基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置(以下简称“排序装置3”)。
[0078] 参照图2,第一获取装置1基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息。
[0079] 其中,所述热点扫描信息包括所述无线热点的位置信息。优选地,所述热点扫描信息还可包括无线热点的名称和信号强度等信息。
[0080] 其中,所述位置信息包括各种可用于表示地理位置的信息。优选地,所述位置信息包括位置坐标信息。
[0081] 具体地,对于已扫描的每个无线热点,第一获取装置1可直接通过对该无线热点进行定位来得到其对应的位置信息。
[0082] 优选地,所述第一获取装置1包括:用于对热点扫描信息进行预处理,以去除与移动热点相关的数据的装置(图未示,以下简称“预处理装置”)和用于的装置(图未示,以下简称“位置确定装置”)。
[0083] 预处理装置先对热点扫描信息进行预处理,以去除与移动热点相关的数据。接着,位置确定装置基于预处理后的热点扫描信息,确定用户所在的无线热点的位置信息。
[0084] 例如,预处理装置通过计算某无线热点的所有有效定位点与平均定位点距离的方差,当方差高于500米时,认为是移动热点,并予以去除。
[0085] 优选地,第一获取装置1可将用户已连接的无线热点作为用户所在的无线热点,并获取其位置信息。
[0086] 需要说明的是,用户通过用户设备扫描某个无线热点时可能会由于所处位置的不同而产生与该无线热点对应的多个定位点,
[0087] 优选地,当用户通过用户设备扫描某个无线热点并产生与该无线热点对应的多个定位点时,第一获取装置1基于该无线热点的各个定位点的位置信息计算平均位置,作为该无线热点的位置信息。
[0088] 优选地,第一获取装置1可基于各个多个定位点的信号强度,从所述多个定位点中选择一个或多个作为有效定位点,并基于各个有效定位点的位置信息计算平均位置,作为该无线热点的位置信息。
[0089] 根据本发明的第一示例,匹配装置包含于提供在线广告推送服务的网站的服务器中。用户通过智能手机扫描附近的无线热点并扫描到无线热点wifi_1,则匹配装置得到来自该智能手机的、对应于无线热点wifi_1的无线热点信息包括:无线热点wifi_1对应的多个定位点的位置信息和信号强度信息。第一获取装置1选取信号强度高于-80dBm的定位点作为有效定位点,接着基于该多个有效定位点的经纬度坐标信息,计算得到平均位置坐标信息location_1,作为该无线热点wifi_1的位置信息。
[0090] 需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于用户已扫描的各个无线热点的热点扫描信息,获取所述用户所在的无线热点的位置信息的实现方式,均应包含在本发明的范围内。
[0091] 接着,第二获取装置2根据所述位置信息,获取该无线热点附近的一个或多个候选POI。
[0092] 具体地,第二获取装置2基于无线热点的位置信息,获取距离该位置预定范围内的一个或多个POI作为候选POI。其中,第二获取装置2从地图数据中获取各个POI的位置信息,并计算其各自与该位置信息的距离。
[0093] 继续对前述第一示例进行说明,第二获取装置2根据位置坐标信息location_1,将距离该位置300米内的各个POI作为候选POI。
[0094] 接着,排序装置3基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI。
[0095] 其中,所述特征信息包括到访特征信息。所述到访特征信息用于指示预定时段内用户扫描无线热点或搜索POI的总次数和总人次。
[0096] 优选地,到访特征信息包括经统计得到的预定时间段内的用户到访的概率分布信息。例如,过去一天每小时用户扫描无线热点或搜索POI的总次数的概率分布信息。
[0097] 优选地,所述特征信息还可包括可用于指示无线热点或POI的特征属性的信息,例如,“购物”、“美食”或“酒店”等POI的类别信息。
[0098] 其中,匹配装置可通过获取多个用户扫描该无线热点的历史扫描数据来得到其到访特征信息,并通过获取多个用户搜索各个POI的历史搜索数据,来得到其特征信息。
[0099] 具体地,排序装置3可直接基于计算的特征信息来确定无线热点分别和各个候选POI的相似度信息,并基于相似度信息来对各个候选POI进行排序。
[0100] 例如,排序装置3将过去一小时用户扫描无线热点的总人次,和分别搜索各个候选POI的总人次,并分别计基于二者的差值来确定该无线热点和各个候选POI的相似度信息,使得差值越小相似度越高,并基于相似度来对各个候选POI进行排序。
[0101] 根据本发明的一个优选实施例,特征信息包括作为排序模型的输入参数的参数特征信息,所述排序装置3包括用于基于所述排序模型,并基于对应于所述无线热点和所述各个候选POI的一项或多项特征信息,计算所述无线热点和所述各个候选POI的匹配程度信息的装置(图未示,以下简称“计算装置”),和用于基于所述匹配程度信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的装置(图未示,以下简称“子排序装置”)。
[0102] 计算装置基于所述排序模型,并基于对应于所述无线热点和所述各个候选POI的一项或多项特征信息,计算所述无线热点和所述各个候选POI的匹配程度信息。
[0103] 其中,所述排序模型包括各种基于机器学习方法建立的、可用于预估无线热点和多个POI的匹配程度并对各个POI进行排序的模型。
[0104] 优选地,匹配装置采用基于学习排序方法(learn-to-rank)的得到的排序模型来计算所述无线热点和所述各个候选POI的匹配程度信息。
[0105] 优选地,匹配装置可采用基于LambdaMART算法得到排序模型。
[0106] 其中,作为所述排序模型的输入参数的参数特征信息包括但不限于以下至少任一项信息:
[0107] 1)无线热点的到访特征信息;
[0108] 2)各个候选POI的到访特征信息;
[0109] 3)无线热点和各个候选POI的相关性特征信息;优选地,所述相关性特征信息包括:
[0110] i)无线热点与poi的距离;
[0111] ii)无线热点与poi到访特征信息的向量;例如,时用户扫描无线热点或搜索POI的总次数的概率分布信息的内积
[0112] iii)无线热点与poi对应的用户到访的总次数和总人次的比值。
[0113] 接着,子排序装置基于所述匹配程度信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI。
[0114] 继续对前述第一示例进行说明,匹配装置采用基于LambdaMART算法得到的排序模型model_1。匹配装置多个用户扫描该无线热点wifi_1的历史扫描数据得到其到访特征信息包括:过去一周内每一天24小时的用户扫描的总次数和总人次的概率分布信息pro_1,并通过获取多个用户搜索各个POI的历史搜索数据得到其到访特征信息包括:过去一周内每一天24小时的用户搜索各个候选POI的总次数和总人次的概率分布信息pro_2。
[0115] 则匹配装置得到以下参数特征信息作为排序模型model_1的输入参数:无线热点wifi_1对应的概率分布信息pro_1;各个候选POI对应的概率分布信息pro_2;概率分布信息pro_1和概率分布信息pro_2的内积;无线热点wifi_1与各个候选POI对应的用户到访的总次数和总人次的比值。
[0116] 接着,计算装置基于上述参数特征信息,计算所述无线热点wifi_1和各个候选POI的匹配程度信息,子排序装置对各个候选POI进行排序,并将排名第一位的候选POI作为与该无线热点wifi_1相匹配的POI。
[0117] 需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何匹配装置基于对应于所述无线热点和所述各个候选POI的特征信息,对各个候选POI进行排序,从而确定与该无线热点相匹配的POI的实现方式,均应包含在本发明的范围内。
[0118] 优选地,所述匹配装置还包括用于获取对应于多个无线热点和其附近的候选POI的特征训练信息的装置(图未示,以下简称“训练获取装置”)和用于基于所述特征训练信息训练所述排序模型的装置(图未示,以下简称“模型训练装置”)。
[0119] 训练获取装置获取对应于多个无线热点和其附近的候选POI的特征训练信息。
[0120] 优选地,训练获取装置可基于所述无线热点的名称信息分别与各个POI的名称信息的编辑距离,从所述预定范围内的各个POI中选择一个或多个作为候选POI。
[0121] 模型训练装置基于所述特征训练信息训练所述排序模型。
[0122] 匹配装置可多次执行所述训练获取装置和模型训练装置的操作来训练所述排序模型,并基于预定的方法来评估所训练的排序模型的准确率。例如,可构造一批验证数据。将验证数据输入到排序模型中,并统计排序结果的准确率。
[0123] 根据本发明的方案,基于用户扫描无线热点的相关数据得到与无线热点相匹配的POI,来预测用户实际到访过的POI,而无需人工采集数据或用户反馈的过程,提升了效率;并且,根据本发明的方案,基于无线热点和POI的到访特征信息来确定相匹配的POI,提升了匹配结果的准确性。
[0124] 本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路。
[0125] 另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
[0126] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。