(2)数据整理
数据整理就是消除噪声或不一致数据,是数据挖掘的必要环节。由数据收集阶段得到的数据可能有一定的“污染”,表现在数据可能存在自身的不一致性,或者有缺失数据的存在等,因此数据的整理是必须的。同时,通过数据整理,可以对数据做简单的泛化处理,从而在原始数据的基础之上得到更为丰富的数据信息,进而便于下一步数据挖掘的顺利进行。
(3)数据挖掘
利用各种数据挖掘方法和工具对数据进行分析。
(4)信息表示
信息表示是使用可视化和知识信息表示技术,向用户提供挖掘的知识信息,是数据挖掘结果呈现的重要手段。有效清晰的挖掘结果信息表示将极大地促进决策的准确性和高效性。
(5)分析决策
数据挖掘的最终目的是辅助决策。决策者可以分析数据挖掘的结果,结合实际情况,调整决策策略等。
总之,数据挖掘过程需要多次的循环反复,才有可能达到预期的效果。
4. 轨道交通AFC数据处理方法
4.1 轨道交通自动售检票系统数据需求分析
保证轨道交通数据分析方法成功的关键有两个:一是准确地定义所要解决的问题,即明确轨道交通AFC数据分析的目的;二是综合利用、合理选择各类数据分析工具和方法,建立完整、高效的轨道交通AFC数据分析系统。轨道交通AFC数据分析是一个系统的过程,需要经过数据采集、数据处理、数据分析、结果表示等流程,借助数据分析工具,利用适合的数据分析算法才能得以实现。因此,进行轨道交通AFC数据分析必须将数据分析的各个环节有机地结合,正确选用各类数据分析工具及算法,保证各数据处理环节科学、准确,进而建立起一套完整的数据分析系统。
1)轨道交通自动售检票系统数据提取需求
分析轨道交通AFC数据的目的是为了使决策者掌握更加详细、准确的数据与相关指标,为决策提供可靠依据。其主要需求来自于公共交通管理者和规划者这两个主体。公共交通管理者注重线路运营管理效率的高低,需要掌握线路与站点的日客流量、客流时空特性、、线路车辆运营速度、满载率等指标,以此为依据,进行各项运营管理决策,如制定。修改线路车辆发车、工作人员排班计划等;作为公共交通规划者,需要掌握全市或某区域公共交通客流总量随时间的变化以及客流出行起讫点,通过对未来年进行客流预测,结合其他必要因素,完成轨道交通线路或线网的路线规划设计和站点设置。因此管理层面需要的数据指标包括:线路、站点的日客流量,高峰小时客流量,换乘客流量,乘客出行时间,车辆周转时间,线路不均匀系数,满载率,运营速度等;规划层面则需要线路、站点嫉妒/年客流量,站点换乘流量,出行时间,乘客出行起讫点等。
2)轨道交通自动售检票系统数据提取分析过程
由原始数据到轨道交通的运行信息,轨道交通AFC数据分析需要经过数据预处理、数据分析、解释评价三个过程。
(1)数据预处理
数据预处理是对数据仓库中数据进行筛选、清理,保留合理、准确的数据,缩小数据范围,以提高轨道交通AFC数据分析的质量。数据预处理是简单的数据筛选过程,可以利用数据仓库工具或数据分析工具进行。
(2)数据分析
数据分析是轨道交通AFC数据分析的核心环节,是指综合利用多种数据分析方法对预处理过的轨道交通AFC数据进行信息提取。
(3)解释评价
解释评价是指根据轨道交通AFC数据分析得到的结果,利用可视化图表、曲线显示给用户,以便用户直观掌握轨道交通客流各类特征。根据用户的不同要求,分析结果以不同的内容和形式呈现。如分析某条轨道线路高峰小时或一天的客流分布情况,数据分析系统会给出不同的结论和表现方式,这些分析结果不仅可提供给用户查看,也可以存储在知识库中,供日后分析和比较。 轨道交通自动售检票系统AFC数据分析(9):http://www.751com.cn/zidonghua/lunwen_2395.html