以数据为中心的基本思想是,把传感器看作感知数据流,把传感器网络视为感知数据库,把数据管理和处理视为网络的应用目标。与传统数据对象相比,无线传感器网络感知数据又有许多新特征:第一,感知数据是被感知物质现象的离散样本,不能直接回应复杂数据查询;第二,无线传感器网络数据传感器节点故障频繁、数据传输丢包率高、网络拓扑结构不断变化,所以感知数据是不精确和不完整的;第三,无线传感器网络在时域和空域上有巨量的冗余感知数据,数据规模过于庞大。因此,对于无线传感器网络来说,数据采集机制应该有助于复杂数据查询处理,能预测丢失或测量点外的信息,能识别异常的数据,能去除冗余内容以降低存储和传输的数据规模[6]。源[自[751^`论`文]网·www.751com.cn/
2.2常见的数据采集技术
因为无线传感器网络是以数据为中心的,必须设计适用于其感知数据的采集方式。该方式需能满足无线传感器网络数据查询处理、健壮性和低冗余度的要求。旭东研究者都对其进行了研究,提出了许多解决方法,方法如下:
2.2.1 网外离线的数据采集方式
无线传感器网络最简单的数据采集方法就是将传感器的数据采集的数据定期发送到基站,由基站进行离线分析处理,传感器节点本身不做任何处理,只是简单地发送或转发感知数据,这是传统网络采用的方式。但是由于传感器节点能耗和通信带宽有限,这种方法不可能用于无线传感器网络的数据采集。对于大规模、高密度布置的无线传感器网络来说,这种数据采集方式通信开销过大,传感器传输信息要比执行计算更消耗电能。在传感器网络的实际应用中,普遍认为通信是最耗能的,为了节省节点能量以延长使用寿命,降低节点间的通信干扰,必须降低传感器节点的通信量。
上述问题的一种解决方式是节点间采用多跳路由的方式。多跳路由通信能显著降低通信能量的耗费,距离为s的直接通信与将距离分为n等份的多跳通信(每跳距离变为s/n)相比,两者的能量耗费比值达nα-1以上(α=2~3),节能效果是非常明显的。所以无线传感器网络的节点之间都采用多跳路由的通信方式,一个节点的数据用类似于接力赛跑的方式经过多个中间节点传送到目的节点。不过即便如此,由于节点间所耗费的能量仍然很大,节点间的大量通信会造成通信干扰和信息处理延迟。为了节能、减少节点间的通信量和干扰,在传感器节点对数据进行处理后再传送是一种更合适的方法。
2.2.2 聚合函数操作
采用聚集函数,传感器节点将收集到的数据先进行数据聚集运算后,再将结果发送到Sink节点[6]。这是目前广泛采用的一种数据采集操作。相对于发送原始数据到基站,数据进行聚集处理后,要发送的数据已经减少很多,因此,节点通信所需的能耗大大降低,常用的数据聚集操作有求和、求平均值、记数、求最小/大值等。UC Berkeley大学的研究者融合了网内聚集运算操作,从而开发出了无线传感器网络数据查询处理平台TinyD,这是有代表性的传感器网络数据管理系统。他的开发从两方面的观察开始:首先,单个传感器采集的数据并没有多大的价值。其次,由于带宽和节点能耗的限制,从所有的节点采集也是不现实的。最为有效的是利用聚集函数收集测量值,除了节能外,还有助于减少错误数据对测量的影响,传感器节点读数的聚集值能更精确地反映真实情况。
聚集操作的缺点就是会造成数据结构和形态的丢失,因此难以进行复杂的数据查询处理[7]。个别传感器的异常数据也会由于数据聚集操作而使该信息损失殆尽。如果传感器网络中某个节点的数据与其邻节点的读数相差很远,则这可能是一个错误的读数,由传感器损坏造成。但是也不能排除该传感器节点所在区域有异常现象发生。聚集操作有可能掩盖了这一异常。另外,函数聚集会增加网络的延迟,并降低网络的鲁棒性。虽然数据聚集操作大降低了数据冗余性,但丢失数据量的同时也损失信息,使鲁棒性降低。因此,依靠数据聚集操作不能满足数据采集的要求。