无线传感器网络环境监测中基于压缩传感的数据收集方法转让专利

申请号 : CN201210284944.7

文献号 : CN102843757B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孔令和刘小洋薛广涛伍民友

申请人 : 上海交通大学

摘要 :

本发明提供无线传感器网络环境监测中基于压缩传感的数据收集方法,基于的理论为压缩传感和时间序列预测,通过收集来的环境数据动态调整采集概率和工作/休眠占空比,使得用最少的数据采集就能够复原给定精度要求的总体环境。本发明易于实现,复原精度高,数据采集量小,能量和存储资源消耗少。

权利要求 :

1.一种无线传感器网络环境监测中基于压缩传感的数据收集方法,其特征在于,包括如下步骤:

步骤1:在一个O周期开始时,所有节点将上一个C周期所采集并存储着的数据都收集到汇聚节点;

步骤2:在这个O周期的每一个时间槽中,每一个节点都采集一次环境数据,并将数据传输给汇聚节点;

步骤3:汇聚节点在这个O周期结束前,以本周期内所有节点采集到的数据为基础做数据分析,判断下一个C周期中无线模块持续关闭的时间槽长度tθ和采集概率p的数值是否可以被预测;

步骤4a:若所述步骤3的判断结果是否定的,则跳过C周期,直接进入下一个O周期;

步骤4b:若所述步骤3的判断结果是肯定的,则计算紧接着的C周期的无线模块持续关闭时间槽tθ和采集概率p的具体数值,并广播给所有节点,然后进入步骤5;

步骤5:所有节点进入到C周期,关闭无线模块;在总长为tθ的周期中的每一个时间槽中,每一个节点都以概率p进入半休眠状态,采集数据后存储在本地;其它时间槽均处在休眠状态;直到C周期结束为止;然后重新回到所述步骤1,开始新的周期交替过程;

其中,O周期为无线模块开启周期,C周期为无线模块关闭周期;

所述步骤3包括子步骤:通过判断无线模块持续开启的时间槽长度to段内所收集的环境矩阵X的秩的时间序列R是否可以被预测来确定tθ和p是否可被预测;

所述步骤4b中的计算紧接着的C周期的无线模块持续关闭时间槽tθ包括子步骤:-R序列预测步骤:根据O周期内收集来的数据建立环境矩阵 计算此环境矩阵的秩的时间序列 确定秩的时间序列是否可预测,若可预测,则预测之后任一时间槽环境矩阵的秩 其中τ>to,即- 秩 误 差 序 列 预 测 步 骤 : 建 立 秩 误 差 序 列其中任一 是由ARIMA模型基于

序列(r1,r2,...,rτ-1)预测而得的;误差序列建立后,仍然利用ARIMA模型预测之后任一时间槽误差序列的值 其中τ>to,即-计算tθ步骤:先定义累积误差 也就是说在时间槽j的累积误差是从时间槽to+1到时间槽j的所有预测误差的总和;给定一个置信空间系数ζ,ζ的取值在0~100%之间;因此tθ=max(j)-to,其中j满足 同时在时间槽j的秩也得到;

所述步骤4b中的计算紧接着的C周期的采集概率p包括子步骤:-令总收集的数据量K符合K≥β·r·log2(n·t/r),其中β是一个常系数,r是矩阵的秩,n是矩阵的行数即传感器节点数目,t是矩阵的列数即时间槽数目,且K的收集在矩阵中符合随机分布;在一个OC交替周期内t=to+tθ;矩阵的秩由预测所得并保有置信区间,得到 代入得-传感器节点分成O周期和C周期,在O周期至少采集量为K·to/(to+tθ),在C周期至少采集量为K·tθ/(to+tθ),则采集概率能够计算得到为p=M/(n·tθ);将M和K代入,得到-通过公式 基于O周期收集的所有数据 计

算β,其中 是矩阵的秩;其 中Ko是未知数,取值范围为1≤Ko≤(n·to);Ko是满足 的最小采集量,基于O周期数据遍历得到;

-将β代入公式p中,得到min(p)的值。

说明书 :

无线传感器网络环境监测中基于压缩传感的数据收集方法

技术领域

[0001] 本发明涉及的是一种用于环境监测的无线传感器网络的技术,尤其是一种低功耗低存储空间的数据收集方法,具体涉及无线传感器网络环境监测中基于压缩传感的数据收集方法。

背景技术

[0002] 无线传感器网络的主要应用之一是对环境进行长期的监测。环境监测是在一段时间内通过布撒的传感器网络收集数据并能够高精度的复原出环境的变化过程。因此数据收集是环境监测中必不可少的过程。数据收集涉及三项指标分别是能耗、存储空间和复原精度。
[0003] 能耗:由于无线传感器网络的节点通常使用电池,在布撒后又不容易更换电池或充电。要求节点在工作过程中尽量节能,使得符合长时间的环境监测的要求。节点的主要耗能在数据传输上,比如常用的TelosB传感器节点使用CC2420无线模块,在接收状态损耗21.8mA,在发射状态下损耗19.5mA,在关闭无线模块仅传感数据的情况下耗能仅1.8mA,在休眠状态下仅几个μA。(数据来源:Y.Liu,Q.Zhang,and L.Ni,“Opportunity-based Topology Control in Wireless Sensor Networks,”IEEE Transaction on Parallel and Distributed Systems (TPDS),Vol.21,No.3,March 2010.)由此可见在数据收集过程中,主要的能耗是在数据传输上,而数据采集和休眠状态的耗能都比较低。
[0004] 存储空间:收集回来的数据需要存储空间保存,由于环境监测常常需要大规模的长期的数据收集,因此会占用大量的存储空间。根据报告统计2011年全世界产生的数据(主要是传感而来的数据)增量速度比全世界存储设备的生产增量速度快了31%。在2007年时,全世界产生的数据总量已经相当于全世界生产出的存储设备的总量,在2011年前者已经是后者的两倍了。(数据来源:R.Baraniuk,“More Is Less:Signal Processing and the Data Deluge,”Science,vol.331,no.6018,pp.717-719,February 2011.)由此可见,传感器网络在大规模长期的环境监测的数据收集过程中需要控制数据量,否则会引发严重的数据泛滥问题。
[0005] 复原精度:通过传感器网络进行环境监测的目的就是能在信息世界中复原并重构出环境变化的过程,因此要求收集回来的数据在特定插值算法后能够达到应用所要求的复原精度。
[0006] 已有的无线传感器网络数据收集解决方案主要包括:
[0007] (1)传统数据收集。如图7所示,应用了传统数据收集方法的每一个节点在每一个时间槽内采集一次数据,并且保持无线模块开启用以数据传输。
[0008] (2)低占空比方法。如图7所示,应用了低占空比数据收集方法的节点在固定周期的若干个时间槽内进行采集和传输的工作,其它时间槽内均处在休眠状态。
[0009] 对现有技术的检索发现,现在的无线传感器网络数据收集方法在环境监测应用中存在以下不足之处:
[0010] (1)传统数据收集。可以认为该方法收集的数据是完整的,无须插值已经能够复原环境的变化,即达到精度最高。但是该方法因为每一节点每一时间槽采集数据,所以耗费大量存储空间。因为无线模块保持开启状态,因此能耗高。
[0011] (2)低占空比方法。该方法节省了能耗和存储空间,但是由于环境变化是非规律的,固定周期的收集方法使得复原的精度无法保证。

发明内容

[0012] 本发明针对现有技术存在的不足,提供一种随环境动态变化的数据收集技术,基于的理论为压缩传感和时间序列预测,实现保证复原精度要求下的低能耗低存储空间的数据收集方法。
[0013] 本发明用到的变量名、缩写、专有名词定义如下:
[0014] to:无线模块持续开启的时间槽长度。
[0015] tθ:无线模块持续关闭的时间槽长度。
[0016] p:采集概率。
[0017] n:网络中传感器节点的总数。
[0018] i:网络中每个节点的赋予一个ID号,分别为1,2,...,i,...,n。
[0019] t:环境监测总时间槽数。
[0020] j:监测时间段中的每个时间槽赋予一个标号,分别为1,2,...,j,...,t。
[0021] x(i,j):节点i在时间槽j采集到的环境数据。
[0022] X=(x(i,j))n*t:环境变化矩阵,表示整个t时间段内环境的变化,可以认为所有节点在所有时间槽都采集来的环境数据。
[0023] 指示矩阵,用1和0分别表示环境数据在该节点位置该时间槽有无被采集到。
[0024] G:数据收集矩阵,只记录传感器网络实际收集来的环境数据,若第i节点在第j时间槽采集了数据,则G矩阵的第i行第j列元素为x(i,j);若第i节点在第j时间槽没有采集数据,则G矩阵的第i行第j列元素为0。可以认为G=X·B。
[0025] 插值后矩阵,对比与环境变化矩阵X,数据收集矩阵G存在0元素,通过插值或估计将矩阵G中的0元素复原出来产生矩阵 用来近似矩阵X。
[0026] R=(r1,r2,...,rτ):秩序列,一个由秩的时间序列组成的行向量。r1表示给定矩阵的第一列向量的秩(即第一个时间槽内所有节点采集到的数据组成的列向量的秩),r2表示给定矩阵中的第一列和第二列数据组成的矩阵的秩,rτ表示给定中的第一列一直到第τ列数据组成的矩阵的秩。
[0027] O:无线模块开启周期的缩写。
[0028] C:无线模块关闭周期的缩写。
[0029] 汇聚节点:数据收集用的节点,一般和电脑相连,一个传感器网络中通常至少有一个汇聚节点,网络中的其它节点将采集的数据都传输给汇聚节点。
[0030] 数据收集:是整个无线传感器网络的共同工作。所有节点均进行数据的采集后传输给汇聚节点完成数据收集工作。
[0031] 数据采集:每个节点通过自身的传感模块采集到的环境变量数值(比如温度、光照、湿度)的过程称之为数据采集。
[0032] 数据传输:每个节点通过自身的无线模块将采集到的数据进行发送、接收、转发的工作为数据传输。
[0033] 工作状态:传感器节点进行数据采集、接收和发送。无线模块和传感模块均开启,高耗能。
[0034] 休眠状态:传感器节点休眠不工作。无线模块和传感模块均关闭,超低耗能。
[0035] 半休眠状态:传感器节点只采集数据不传输数据。采集到的数据存储在本地。传感模块开启但无线模块关闭,低耗能。
[0036] 压缩传感:一种插值理论,通过少量的采集数据恢复全局数据的方法。
[0037] 环境复原:也称之为环境重构。用传感器网络收集来的数据通过插值方法恢复出一段时间内整个环境的变化过程。在本发明中提到的环境复原均采用压缩传感理论的方法进行插值。
[0038] 本发明所述的收集方法在无线传感器网络中的实际表现如说明书附图所示,节点的工作周期可以看作无线模块的开启O与关闭C周期的交替进行。在无线模块开启的周期O内,节点处于工作状态,进行数据采集、数据传输的工作,无线模块开启周期O的长度to由用户事先给定;在无线模块关闭的周期C内,节点以采集概率p进入半休眠状态,只采集数据不传输数据,由传感模块采集来的数据保存在本地存储单元中直到下一次无线模块开启时一并传输。其它概率即1-p概率情况下,节点进入休眠状态不采集数据。无线模块关闭周期C的长度tθ和采集概率p由前一次O周期内所收集到的环境数据计算得到,是按环境变化动态改变的。
[0039] 根据本发明的一个方面,提供一种无线传感器网络环境监测中基于压缩传感的数据收集方法,包括如下步骤:
[0040] 步骤1:在一个O周期开始时,所有节点将上一个C周期所采集并存储着的数据都收集到汇聚节点;
[0041] 步骤2:在这个O周期的每一个时间槽中,每一个节点都采集一次环境数据,并将数据传输给汇聚节点;
[0042] 步骤3:汇聚节点在这个O周期结束前,以本周期内所有节点采集到的数据为基础做数据分析,判断下一个C周期中无线模块持续关闭的时间槽长度tθ和采集概率p的数值是否可以被预测;
[0043] 步骤4a:若所述步骤3的判断结构是否定的,即按判断不可被估算,则跳过C阶段,直接进入下一个O周期;
[0044] 步骤4b:若所述步骤3的判断结构是肯定的,即按判断可以被估算,则计算紧接着的C周期的无线模块持续关闭时间槽tθ和采集概率p的具体数值,并广播给所有节点,然后进入步骤5;
[0045] 步骤5:所有节点进入到C周期,关闭无线模块;在总长为tθ的周期中的每一个时间槽中,每一个节点都以概率p进入半休眠状态,采集数据后存储在本地;其它时间槽均处在休眠状态;直到C周期结束为止;然后重新回到所述步骤1,开始新的周期交替过程;
[0046] 其中,O周期为无线模块开启周期,C周期为无线模块开启周期。
[0047] 技术方案的优化目标:
[0048]
[0049] 其中||·||是Frobenius范数,用来衡量矩阵X和 间的差别,其计算方法为[0050]
[0051] εth是给定的复原误差的要求,优化目标中的受限条件表明本发明的方法要求保证复原误差在精度εth范围之内。主要目标中最大化tθ表示尽量延长无线模块关闭的时间,相比于给定的固定长度的无线模块开启时常to,越大的tθ表示越小的开启/关闭占空比,越节省能耗。次要目标中最小化p表示尽量减小采集概率,也就是每个节点采集的数据越少,越节省存储资源。
[0052] 优选地,所述步骤3包括子步骤:通过判断无线模块持续开启的时间槽长度to段内所收集的环境矩阵X的秩的时间序列R是否可以被预测来确定tθ和p是否可被预测。要判断一个时间序列是否可被预测,应用Box-Jenkins方法中的ARIMA模型(差分自回归移动平均模型)。ARIMA方法是成熟的时间序列预测方法,其原理和细节可以参阅相关书籍([书籍]O.D.Anderson.“Time Series Analysis and Forecasting:the Box-Jenkins Approach,”Butterworths,London Edition,1976.)这里只简述步骤:(一)根据序列R的自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其周期变化规律,对序列的平稳性进行识别。(二)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。(三)根据时间序列模型的识别规则,若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型预测;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型预测;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型预测;若平稳序列的偏相关函数和自相关函数均是截尾的,则序列不可被预测。
[0053] 优选地,所述步骤4b中的计算紧接着的C周期的无线模块持续关闭时间槽tθ包括子步骤:(一)R序列预测。根据O周期内收集来的数据建立矩阵计算此矩阵的秩的时间序列 根据前述判断方法确定其是否可预测,若可预测,则预测之后任一时间槽数据矩阵的秩 其中τ>to,即 (二)秩误差序列预测。建立秩误差序列
其中任一 是由ARIMA模型基于
序列(r1,r2,...,rτ-1)预测而得的。误差序列建立后,仍然利用ARIMA模型预测之后任一时间槽误差序列的值 其中τ>to,即 (三)计算tθ。预测
存在误差,在预测 的过程中,随着τ的增大,预测误差也在不断的加大。对于某个应用,需要预测的误差在给定的置信空间之内,所以max(tθ)是满足预测误差要求的最远的时间槽。先定义累积误差 也就是说在时间槽j的累积误差是从时间槽to+1
到时间槽j的所有预测误差的总和。给定一个置信空间系数, 的取值在0~100%之间。
因此tθ=max(j)-to,其中j满足 同时在时间槽j的秩 也得到。如图1
所示,是在给定了 周期to,秩的序列 和置信区间 ,如何计算得
到 和μτ,最终确定tθ和
[0054] 优选地,所述步骤4b中的计算紧接着的C周期的采集概率p包括子步骤:(一)根据压缩传感理论,对于一个矩阵,为保证其复原精度,令总收集的数据量K必须至少符合K≥β·r·log2(n·t/r),其中β是一个常系数,r是矩阵的秩,n是矩阵的行数即传感器节点数目,t是矩阵的列数即时间槽数目,且K的收集在矩阵中符合随机分布。在一个OC交替周期内t=to+tθ。矩阵的秩由预测所得并保有置信区间,所以 代入得
[0055] (二)传感器节点分成O周期和C周期,因为要求符合随机分布,则在O周期至少采集量为K·to/(to+tθ),本发明技术方案在O周期任一节点任一时间槽都采集一次数据,远远超过此采集量;在C阶段至少采集量为M=K·tθ/(to+tθ),因为一个C周期内总节点数依旧是n,总时间槽数是tθ,则采集概率可以计算得到为p=M/(n·tθ)。将M和K代入,可以得到[0056]
[0057] (三)上式中的β由于是常系数,可以认为在连续的一个OC交替周期内β保持不变。所以通过公式 基于O周期收集的所有数据来计算β,其中 是矩阵 的秩。公式中只有Ko是未知数,取值范围为1≤Ko≤(n·to)。
因为设定了复原误差要小于εth,所以Ko是满足 的最小采集量,可
以基于O周期数据遍历得到。(四)将β代入公式p中,得到的min(p)值。
[0058] 本发明主要应用于环境监测,优势在于低功耗和低存储资源损耗。本发明基于压缩传感理论,通过收集来的环境数据动态调整采集概率和工作/休眠占空比,使得用最少的数据采集就能够复原给定精度要求的总体环境。本发明易于实现,复原精度高,数据采集量小,能量和存储资源消耗少。

附图说明

[0059] 通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0060] 图1为无线模块关闭周期tθ计算方法的示意图。
[0061] 图2为实施例原型系统照片,显示了实验传感器部署。标注Note1表示3个传感器节点放在同一位置,标注Note2表示汇聚节点。
[0062] 图3为实施例原型系统和对比系统平面分布图。其中,环境监测区域:传感器部署在4x 4的网格上,每3个传感器为一组。
[0063] 图4为实施例复原误差比较图。
[0064] 图5为实施例占空比即能耗比较图。
[0065] 图6为实施例存储量比较图。
[0066] 图7为本发明的方法与传统数据收集方法、低占空比方法的状态比较图。

具体实施方式

[0067] 应用场景:通过无线传感器网络对给定的7.2m*6m的区域进行连续10天的环境变化监测,16个采集点,时间槽长度为1分钟,要求复原误差在5%以内。
[0068] 原型系统和对比系统:本实施例共采用51个TelosB无线传感器节点,可以对环境的温度、湿度和光照进行监测,传输通过802.15.4即Zigbee协议在2.4GHz频段工作。51个节点共分成3组,每组17个节点,用ABC来区分组别。如图2、3所示,每组有1个节点作为汇聚节点,与笔记本电脑直接相连;其它16个节点用来采集和传输环境数据。在环境监测区域内,以4*4的网格状选择16个采集点位置,横向间距为2.4m,纵向间距为2米。每个组别中各选择1个节点放在采集点位置上,所以每个位置上有3个传感器节点分别属于ABC组,用以对比,如图2和图3所示。
[0069] 组别A为对比系统,实施传统数据收集方法。每个时间槽每个节点采集一次数据并传输。无线模块保持开启状态,完成数据的发送、接收和转发。传统数据收集方法数据无复原误差,用来做对比。
[0070] 组别B为对比系统,实施固定周期低占空比数据收集方法。一个OC交替周期设置为固定长度4小时。其中前30分钟为工作周期,后3.5小时为休眠周期,占空比为固定数值12.5%。在工作周期,每分钟每个节点采集一次数据并传输,无线模块保持开启状态,完成数据的发送、接收和转发。在休眠周期,所有节点休眠,不采集不传输,无线模块保持关闭。
(同时测试了固定占空比为6.25%,25%,50%的场景,12.5%是符合复原误差在5%以内的最小固定占空比。)
[0071] 组别C为原型系统,实施固本发明的数据收集方法。具体实施步骤如下:设定无线模块开启时长为to=30分钟,置信区间 复原误差要求εth=5%。一个OC交替周期中(先O后C为例):(1)在一个O周期开始时,16个节点将上一个C周期所采集并存储着的数据都收集到汇聚节点。(2)在这个O周期共30分钟的每一分钟,每一个节点都采集一次环境数据,并将数据传输给汇聚节点。(3)汇聚节点在这个O周期结束前,以本周期内所有节点采集到的数据为基础做数据分析,判断下一个C周期中tθ和p的数值是否可以被预测。(4.1)若按判断不可被估算,则跳过C阶段,直接进入下一个O周期。(4.2)若按判断可以被估算,则计算紧接着的C周期的无线模块持续关闭时间槽tθ和采集概率p的具体数值,并广播给所有节点。(5)所有节点进入到C周期,关闭无线模块。在总长为tθ的周期中的每一个时间槽中,每一个节点都以概率p进入半休眠状态,采集数据后存储在本地。其它时间槽均处在休眠状态。直到C周期结束为止。然后重新回到第(1)步,开始新的周期交替过程。其中可预测性判断,tθ和p的计算方法分别按照技术方案中所述细节计算。
[0072] 效果比较:共有3项指标,分别是复原误差ε,平均占空比α,和存储空间。复原误差ε是收集后的数据经过压缩传感插值后得到的环境变化过程估计矩阵 和环境变化矩阵X的误差,前述定义中已经给出这个指标的定义公式。复原误差越小越好,按此实施例要求最大不能超过5%,否则不符合精度要求。平均占空比是在整个10天的监测过程中,无线模块开启时间占总时间的比例。因为能耗比较无法直接测量,所以用平均占空比α来比较能耗的多少,α值越小表明能耗越少。存储空间是收集来的数据占笔记本硬盘的大小,单位是MB,每一条采集的记录所需空间为160字节。
[0073] 复原误差效果比较如图4所示,传统数据收集方法收集了所有的数据,复原无误差,所以其复原误差总是0。固定低占空比方法因为设定了占空比为12.5%,所以收集到的数据为总量的12.5%,经过复原后此方法温度的复原误差为3.1%,湿度的复原误差为3.6%,光照的复原误差为5.4%。本发明方法的温度的复原误差为1.8%,湿度的复原误差为2.1%,光照的复原误差为4.7%,均好于固定低占空比方法且符合小于5%的要求。
[0074] 平均占空比效果比较如图5所示,传统数据收集方法无线模块保持开启,故占空比为100%,最耗能。低占空比方法因为设定了固定的占空比,所以其平均占空比为12.5%。本发明的方法占空比根据环境动态变化调整无线模块关闭时长,在此实施例中得到结果温度的平均占空比α为5.3%,湿度的平均占空比α为5.5%,光照的平均占空比α为8.2%。本发明方法能耗远小于传统数据收集方法,比固定低占空比方法还要节能。
[0075] 存储空间效果比较如图6所示,传统数据收集方法收集了所有的数据,所以存储空间损耗大,无论温度湿度还是光照,数据量都达到37.22MB。低占空比方法因为设定了固定的占空比,只在工作状态的情况才收集数据,无论温度湿度还是光照,其数据量都是4.83MB。本发明方法根据实际环境变化动态调整采集概率,在此实施例中得到结果温度的数据量为2.69MB,湿度的数据量为2.81MB,光照的数据量为3.76MB。本发明方法存储空间要求远小于传统数据收集方法,比固定低占空比方法还要节省存储空间。
[0076] 图7为本发明的方法与传统数据收集方法、低占空比方法的状态比较图。假设一个传感器网络有3个节点组成,环境监测时间被划分成30个时间槽,每个单元格表示某一节点在某一时间槽的状态。在无线传感器网络中,数据传输耗费大量的能量,数据采集将占用存储空间,从图中可以看到本发明方法数据传输时间短,数据采集量少,占空比动态调节,节省了能量和存储资源的消耗。(且通过压缩传感复原后精度高。)
[0077] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。