一种基于异构迁移学习的室内定位方法转让专利
申请号 : CN202110102396.0
文献号 : CN112954632B
文献日 : 2022-01-28
发明人 : 郭贤生 , 赵梦雪 , 李会勇 , 李林 , 黄健 , 段林甫 , 殷光强 , 万群 , 沈晓峰
申请人 : 电子科技大学
摘要 :
权利要求 :
1.一种基于异构迁移学习的室内定位方法,其特征在于,包括以下步骤:S1、在定位环境中部署路由器,并将环境划分为间隔距离相同的均匀格点;
S2、采集源域数据:
S21、依次将探测设备置于定位环境中的各个格点并记录下此时的探测设备位置坐标,然后探测周围路由器的信号,记录接收到的各路由器的RSS值;
S22、将步骤S21中得到的所有RSS值和格点位置存储下来,作为WiFi指纹库,同时也是源域数据;
S23、随机将探测设备置于定位环境中的部分格点,并记录接收到的路由器的RSS值,作为共现数据中与源域相关的一部分;
S3、采集目标域数据:
S31、改变环境中路由器的部署情况,再次将探测设备置于定位环境中并记录接收到的各个路由器的RSS值;
S32、将步骤S31中的得到的RSS值存储下来,作为待定位样本,即目标域数据;
S33、将探测设备置于定位环境中和S23中的一致格点位置,并记录接收到的路由器的RSS值,作为共现数据中与目标域相关的一部分;
S4、将步骤S23和步骤S33中采集到的数据按照格点位置进行拼接,作为共现数据;具体方法是:
设得到的源域数据为 其中 是第i个样本对应所有能被探测到的ms个路由器的所有RSS的向量,ns代表源域的样本总数,随机在整个定位环境中采集RSS数据,记为 作为共现数据中源域信息部分,其中nc代表共现数据样本数;
得到的目标域数据为 其中 是第i个样本对应所有能被探测到的mt个路由器的所有RSS的向量,nt代表目标域的样本总数,ms≠mt,在和源域相同的位置在定位环境中采集RSS数据,记为 作为共现数据中目标域信息部分;
将U和V拼接得到共现数据为Xc=[U;V];
S5、利用共现数据作为连接源域和目标域的桥梁,获得源域映射到目标域特征空间的映射矩阵,并计算出源域映射后的样本数据;具体方法是:T
通过映射矩阵A将源域映射到目标域的特征空间中:其中,Hts和Hs是矩阵H中的元素, H=M+αL, α是控制映射矩阵复杂度的参数,β是控制拓扑约束重要程度的参数,L=D‑W,W(i,j)=w(xi,xj)是相似度矩阵,D(i,i)=∑jW(i,j)是一个对角线矩阵, 是单位矩阵,w(xi,xj)具体为:
其中 其中uk是第k个共现数据样本中和源域相同的部分,vk是第k个共现数据样本中和目标域相同的部分;
M具体为:
映射后的数据为 和Xt是同构数据,从而在目标域的特征空间中,使用机器学习算法进行位置估计;
S6、利用映射后的有标签源域数据训练分类器,为无标签的目标域数据进行位置计算,获得定位结果。
说明书 :
一种基于异构迁移学习的室内定位方法
技术领域
背景技术
室内导航等。由于易于广泛部署、成本低、通信能力强等优点,室内定位技术广泛的采用了
基于WiFi指纹定位的定位系统。
的待定位样本与离线指纹库中的样本数据进行对比匹配,完成位置计算。因此,基于WiFi指
纹的定位技术的定位精度取决于指纹库的样本数据的代表性以及定位环境变化的剧烈程
度。
器。在传统的定位方法中通常选择忽略新增的路由器,并且为未被探测到的路由器的信号
强度值补充‑100dB来保持数据维度一致,这将很大程度的增加定位误差,甚至在路由器全
部更换的情况下无法进行位置估计。路由器的数量变化使得在线采集到的待定位样本在特
征维度和种类上与指纹库中的样本间存在较大差异,无法使用传统的机器学习方法进行定
位,而异构迁移学习可以很好的解决这个问题。
Heterogeneous Daily Living Activity Learning through Domain Invariant Feature
Subspace,"in IEEE Transactions on Big Data,doi:10.1109/TBDATA.2020.2977626.”
提出了一种新的半监督异构迁移学习算法,该算法利用最大均值差异(Maximum Mean
Difference,MMD)准则将源域数据投影到目标域PCA降维后的子空间中,在新的子空间进行
分布对齐。该方法在实测的智能家居数据中被证明是有效的。该方法包括以下几个步骤:1)
在待定位区域划分格点,并采集每个格点处周围APs(Access Points)的信号强度
(Received Signal Strength,RSS),记录对应坐标值,建立离线指纹库,作为源域数据;2)
改变实验环境,随机关闭部分路由器,并部署部分新的路由器;3)采集环境变化后的RSS数
据,少部分数据记录格点标签,大部分数据不记录标签信息。它们分别作为目标域有标签和
无标签的待定位样本数据。4)利用该方法中的HDLAL方法求解一个映射,将源域数据映射到
目标域PCA降维后的子空间进行对齐;5)在映射后的空间,利用目标域数据和源域数据进行
欧氏距离匹配,计算定位结果。
方法,要求目标域中包含一定数量的有标签数据。但是在室内定位领域,难以获取有准确位
置信息的样本数据;2)对于无标签的目标域数据,该算法采用利用伪标签计算源域和目标
域的条件分布差异,计算结果直接取决于伪标签的精度。因此,该类方法由于上述问题的存
在而在路由器数量变化的室内环境中难以准确、稳定的位置估计。
发明内容
而不需要有标签的目标域数据。其中,共现数据是指同时包含源域特征和目标域特征、标签
对齐但未知的一组数据,它可以是同时采集的严格时间对齐数据,也可以是不同时采集但
标签一致的数据。本发明的方法将源域数据映射到目标域所在的特征空间中,并且与目标
域保持分布一致和拓扑一致。本发明的方法利用共现数据为桥梁,将源域数据和目标域数
据联系起来,从而利用有标签的源域数据更好的辅助目标域数据进行位置计算,有效的提
高路由器维度发生变化的情况下的定位精度。
并加入分布对齐和拓扑一致约束,最后利用映射后的源域辅助目标域数据进行位置估计,
如图1所示,具体包括以下步骤:
由器出现差异,部分路由器可能因故障或关闭无法被再次探测到,并且探测到一些新增的
路由器;
位环境中采集RSS数据,记为 作为共现数据中源域信息部分,其中nc代表共现数
据样本数;
相同的位置在定位环境中采集RSS数据,记为 作为共现数据中目标域信息部分;
(xi,xj)是相似度矩阵,D(i,i)=∑jW(i,j)是一个对角线矩阵, 是单位矩阵,w(xi,
xj)具体为:
算。在环境变化剧烈的WiFi指纹定位中,当路由器发生大量的更换甚至完全更换时,传统的
定位方法必须建立新环境中的指纹库才能完成定位。而本发明通过将已有的源域指纹库映
射到目标域空间中,避免了这一个耗费人力时间成本的环节。因此,本发明可以在实际定位
中待定位环境路由器变化剧烈的情况中发挥非常重要作用。
附图说明
具体实施方式
将每层楼分别划分为106个格点,共212个格点,两层楼的格点位置对应相同,每个格点与邻
近格点间隔为0.9m。
录数据,最终得到的源域数据为 其中 是第i个样本对
应所有能被探测到的ms个路由器的所有RSS的向量,ns代表源域的样本总数。同时,随机在整
个定位环境中采集RSS数据,记为 作为共现数据中源域信息部分,其中nc代表共
现数据样本数。
信号强度并记录数据,最终得到的目标域数据为 其中
是第i个样本对应所有能被探测到的mt个路由器的所有RSS的向量,nt代表源域的样本总数,
通常ms≠mt。
到最终的共现数据为Xc=[U;V]。
中。映射后的数据为 和Xt是同构数据。因此可以在目标域的特征空间中,使用常
见的机器学习算法进行位置估计。
算条件分布式,目标域使用伪标签,具体数学表达如下:
数据域提出了不同的计算方法。当两个样本来自同一数据域时,它们具有相同的特征维度,
可以直接使用Pearson相关系数来表示两个样本的相似度。但是当来自不同数据域时,样本
维度不一致,无法直接计算相似度,因此利用共现数据作为桥梁,计算异构数据之间的相似
度大小。具体评估方法如下:
结果。
定位误差小于2米的样本占27%,定位误差小于3米的样本占50%。图2为背景技术中采用的
方法和本发明方法的定位误差性能比较图,其中背景技术中的方法在路由器数量变化的情
况下定位效果要差于本发明的方法,这是因为背景方法虽然对源域数据进行了映射处理,
但是约束条件只有分布对齐,而未充分考虑源域和目标域之间的联系。而本发明提出的方
法不但对齐了源域和目标域之间的分布,而且充分利用共现数据作为桥梁,将每一个源域
样本和目标域样本联系起来进行拓扑优化。本发明方法将源域映射到目标域所在特征空
间,既防止了添加‑100dB带来的定位误差,又保证了源域和目标域的维度一致,可以使用传
统的定位方法进行位置估计。实验结果证明了本发明提出的算法是一种定位精度高、稳健
性好的定位方法。