一种基于wifi定位的进店顾客数据统计方法转让专利
申请号 : CN201711169283.2
文献号 : CN108090493B
文献日 : 2019-03-05
发明人 : 张振鑫 , 张力立 , 洛桑扎西
申请人 : 南京光普信息技术有限公司
摘要 :
权利要求 :
1.一种基于wifi定位的进店顾客数据统计方法,其特征在于包括如下步骤:步骤1,识别店铺区域,获得店铺区域边界;
所述步骤1中,根据商场平面图,选定店铺区域内任意一点作为目标点,由目标点向外扩展,将颜色相近得到的像素点判断为店铺区域内,从而获得店铺区域边界;
所述步骤1的详细内容是:
步骤11,根据商场平面图获取每个像素点的坐标和RGB颜色值;
步骤12,选定店铺区域内任意一点作为目标点,将该点上色为标识该店铺的唯一色;
步骤13,从目标点出发,用迭代的方式扫描当前像素上下左右四个方向的邻近点,若某点的RGB颜色值满足相近色公式:|r-r0|+|g-g0|+|b-b0|≤thresh,其中,thresh为阈值,则将该点视为相近颜色点,认为该点与目标点属于同一店铺;若在扫描过程中,某个点的RGB颜色值不满足相近色公式,那么认为该点已经位于店铺外,停止该方向的扫描;然后对该点的4个邻近点再继续扫描,判断是否颜色相近,直到没有任何邻近点为颜色相近点,扫描结束;
步骤14,记录各店铺所包含的像素点点集{Si},点Si对应坐标(xi,yi),以及该店铺ID及所在楼层;
步骤2,通过机器学习的方法,对wifi定位数据聚类,扩大步骤1获得的店铺边界,获得店铺有效定位区域;
所述步骤2的详细内容是:
步骤21,用机器学习的方法对一定周期的数据进行定位坐标的聚类;
步骤22,对所有该周期内的定位数据进行聚类计算,从而找到客户高频次定位的位置区域点集,设为{Ai},每一个Ai都对应一个坐标(xi,yi);
步骤23,将商场平面图分割成栅格,找出区域点集{Ai}内的高频次定位栅格,满足条件为,栅格内所有定位数据个数占定位总数的一定百分比,将高频次栅格的坐标记为{AGi},每一个AGi都对应一个坐标(xi,yi);
步骤24,对步骤23生成的每个高频次栅格的坐标集合{AGi},计算与标识的店铺区域像素点点集{Si}的距离,然后找到距离最小的店铺,保存为一个店铺ID列表{ASi};
步骤25,再遍历店铺ID列表{ASi},从{AGi}中搜索出标记为属于店铺i的高频次栅格点的坐标点集{ADij},其中,i表示店铺ID,j表示高频次栅格点序号;对每一个店铺ID,对{Si}和{ADij}做交集处理,作为店铺i的有效像素点,并标记为唯一色,将所有像素点位置和颜色保存至文件shoplist中;
步骤3,对每天采集的wifi定位数据进行有效定位区域判定,获得每个手机用户的游逛店铺的时间序列;
步骤4,检验每个手机用户的游逛店铺时间序列,判断顾客是否进店,并利用停留时间来剔除店铺工作人员,从而获得每天每个店铺的有效游逛顾客数,以及其进店、离店和游逛时间。
2.如权利要求1所述的一种基于wifi定位的进店顾客数据统计方法,其特征在于:所述步骤13中,还将属于同一店铺的像素点均上色为同一颜色,且该颜色不同于商场平面图中已存在的任何颜色。
3.如权利要求1所述的一种基于wifi定位的进店顾客数据统计方法,其特征在于:所述步骤3的详细内容是:对实时采集的wifi定位数据进行进店打点,将每条wifi定位记录的坐标与文件shoplist中的像素坐标进行匹配,找到像素颜色值,根据该颜色值判断是否为已经标记的某店铺颜色,或者是无效颜色值,从而判断该记录的wifi坐标有没有进入某一家店铺,然后获得每个手机用户的定位时间序列。
4.如权利要求1所述的一种基于wifi定位的进店顾客数据统计方法,其特征在于:所述步骤4的详细内容是:对每个手机用户的定位时间序列进行漂移检验和时间连续性检验,如果该时间序列有足够长的时间在同一个店铺有效定位区域有足够多的wifi记录数,并且漂移出该店铺有效定位区域的定位坐标没有超过一定阈值,那么判定该用户在此时间段在游逛该店铺,从而得到当天有效游逛该店铺的顾客数,以及进店、离店和停留时间。
5.如权利要求4所述的一种基于wifi定位的进店顾客数据统计方法,其特征在于:判定手机用户进入某个店铺的条件是:a)定义停留时间段D:
D=T2-T1
其中,T1是进入店铺A有效区域的初始时刻,T2是离开店铺A有效区域的最后时刻;
需满足:
3<D<α
参数α为最长客户逛店时间,如果超过该参数α,则判断为工作人员;
b)求得店内记录数比例Rn=count1/count2,其中,count1为店内wifi记录数,count2为停留时间段内所有wifi记录数,需满足:Rn≥β
c)对店铺有效区域内定位wifi记录的连续时间记录取差分,即停留时间片段序列{di},计算停留时长比例Rt=sum({di})/D,需满足:Rt≥γ。
6.如权利要求5所述的一种基于wifi定位的进店顾客数据统计方法,其特征在于:对α、β、γ进行优化,内容如下:a)优化α,对每个店铺的所有MAC地址的停留时间段D做直方图分析,得到人数-时长的分布曲线,曲线的点序列为{(Ni,Di)},其中,Ni为人数,Di为递增的时长范围;
根据该分布曲线判断合理的参数位置,估算得到店铺的工作人员人数为Ns,找到最小的Nj,使得Nj≥Ns,这样对应的Dj即为这家店铺的α的合理取值范围;
b)优化β,将所有店内记录数比例Rn的数据做直方图分析,得到序列{(Ni,Rni)},从直方图的分布形态,找到位于坐标轴左端,即Rn偏小的一端,如果出现小的峰值,则将其剔除掉,并取峰值的Rn作为优化后的β值;
c)优化γ,将所有停留时长比例Rt的数据做直方图分析,得到序列{(Ni,Rti)},从直方图的分布形态,找到位于坐标轴右端,即Rt偏大的一端,如果出现小的峰值,则将其剔除掉,并取峰值的Rt作为优化后的γ值。