3 基于手机定位数据的城市道路交通状态识别探测
3.1数据整理和预处理
3.1.1 解决手机定位数据中存在的噪声问题
由于手机信号存在缺陷以及环境因素的干扰,移动网络手机信号在传输的过程中会受到外界条件的影响,移动数据在获取之后通常都有缺失、冗长、重复和不相容的特性 [8]。
(1)重复位置
在全球移动通信网络中,只要有进行通信业务操作的手机用户就会得到许多有关位置的信息。当全球网络中的手机处于开机状态,手机移动台为了保证与全球通信网络的联系保持联系,手机移动台在每隔一个时间段内会自动的向基站发送信号来报告自己所处的小区识别号。通过这样来判定手机移动台的位置是否发送更新及与全球通信网络是否中断。当蜂窝小区停长时间的记录手机移动台,得到的位置数据机会出现重复性,必须对这些重复性的数据数据进行处理。
(2)虚假切换位置
手机移动台在与全球网络保持良好通信状态时,由于受到自身条件和外界不利环境因素的干扰,基站会在这一时间内将手机移动台虚假切换的位置数据记录下来,应该剔除这些存在虚假切换位置的数据。出现这些状况原因可具体分为以下几种情况。
②波导效应
波导效应主要由建筑物、山谷、狭缝等一些屏障引起的。传播过程中的无线电波如果遇到类似的障碍物体,就在这些障碍间发生反射,波长越短,那么无线电波在这期间发生反射的概率就越大。无线电波在传输的过程中,沿着波导同方向传播的话损耗会较小,信号强度会得到相应的增强,而相反在其他方向传播损耗相对而言就会较大,对应的信号强度则变弱。在城市建筑物集中分布,波导效应的情况会更加普遍。
②乒乓效应
手机用户如果在两个基站之间来回切换记录位置就会导致基站信号强度发送剧烈的变换,这样会对系统资源造成巨大的浪费。这样得效应就是所谓的“乒乓切换”。
③记忆效应
高速行驶的手机移动台在通过密集分布的基站覆盖范围如城市里的地铁、BRT、快速公交等,这时便会产生记忆现象。移动通信网络中,手机移动台会与建立手机移动台与相邻小区的预同步切换关系,
④孤岛效应
在移动通信网络中,由于无线传输环境过好、天线的倾角太小或者是手机基站位置过高的原因,当前服务基站小区可能会将相邻小区服务范围覆盖而导致其他小区在这过程中接收服务小区的信号,将当前小区的资源占用,成为逻辑上的邻近小区,被称为“孤岛效应”。
在手机定位数据中由这些现象所产生的噪声数据普遍存在,这些数据会对交通状态识别产生干扰,所以要对这些数据进行处理和分析。
本论文实验的全球移动通信基站数据包括小区ID、基站ID、位置区ID、经纬度坐标、天线方向角等字段。都是采用Eexcel的格式来进行存储的。
(3)基站数据的预处理
①找出字段值缺失的手机定位数据,剔除这些缺失数据
②在全球网络中,基站系统通常会安装3-6个不同角度的信号收发器而同时将基站小区划分为3-6个服务扇区。每个字段Direction指向各自所在的服务小区,基站小区在这种情况下就会产生3-6条小区ID位置相同但是服务小区不同的基站数据,将这些小区ID字段相同的重复数据剔除。
③将SITE-ID重复的数据剔除。
④将基站数据的经讳度坐标值转换为西安80横纵坐标。如表3-1所示
表3-1 基站样本数据
小区ID 位置区ID 经度 X80 纬度 Y80 方向角 基于手机定位数据的城市道路交通状态识别(4):http://www.751com.cn/zidonghua/lunwen_19035.html