2 技术背景
2.1 XML技术
XML(eXteusible Markup Language),即可扩展符号语言。其作为当今网络时代最重要的计算机语言之一,已经被相当广泛地应用于网络之间数据交互的各种不同领域。因为有了XML的存在,才使我们今天网络运用飞速的发展。因为XML其本身自描述性及其应用的平台无关性,使得XML成为现代几乎所有网络数据交换的标准以及平台[3]。
XML(Extensible Mark Language),它与HTML(Hypertext Mark Language),都是SGML(Standard Generalized Markup Language,即标准通用编辑语言)。XML和的HTML主要区别在于:XML中的标签Tag可以是任意的,而HTML中的标签是有统一的格式的;而且,XML的标签必须是封闭的,且是配对出现。
<?xml version="1.0" encoding ="utf-8"?>>
<root>
<files>
<name>Visual Basic程序设计教学大纲</name>
<path>jiaoxue\Visual Basic程序设计教学大纲.htm</path>
<titles>教学大纲</titles>
</files>
<files>
<name>Visual Basic程序设计教学大纲</name>
<path>jiaoxue\Visual Basic程序设计实验教学大纲.htm</path>
<titles>实验教学大纲</titles>
</files>
</root>
<?xml version="1.0" encoding ="utf-8"?>>这句在所有XML文档中是必须出现的,是XML文档的标志。像“titles”、“path”、“name”等标签被称为XML文档的元素(Element)。元素必须是封闭的,也就是说每个元素之间没有交叉。<root>是文档的根元素(Root Element),一个XML文档只能有一个根元素。文档中可以看出,XML文档的标签都是成对出现的,如<titles>、</titles>、<files>、</files>等。
2.2 异常检测算法
在大部分数据库中包含着极少数的数据对象,它们与其他数据的一般规则不同,这些数据对象就叫做异常点(Outlier),也叫做孤立点。对于不同异常点的检测和分析是一种非常重要的数据的挖掘类型,且被称为异常点挖掘。
对于大部分异常数据的挖掘,则主要是用偏差检测方法,其在数学意义上,偏差则是指不同分类中的反常实例或者是不同于规则的特例,或者观监测数据与模型预测数据值不一致并且随着时间的变化而变化的值等。偏差检测的最基本的目标是找出监测结果与数据模型之间有意义的差别所在,主要的偏差技术有序列异常、聚类、多文数据分析、最近邻居法等。而除了对于识别异常的数据外,异常数据的挖掘还有利于寻找异常数据之间的隐含模型,以便于对于异常数据智能化的分析监测。
3 地铁数据模型分析
在地铁站台及出口路径异常检测系统中地铁数据模型占有至关重要的作用,接下来我将对地铁数据模型进行,详细的分析。一下分为三部分:概要分析、地铁数据模型、异常检查点的设置。
3.1 概要分析
对于本课题的需要,在设计初期,我是在公司附近的地铁中山公园站以及经常出入的徐家汇站等大型换乘公交枢纽进行实地走访,通过地铁实地探访,以及对现场工作人员的走访、观察,得到了相对直观的感受以及一些对于地铁建设的意见和一部分的地铁设施的数据。还了询问了一些地铁异常事件及突发事件如:如人流踩踏,通道修理,设备损坏、被偷,火灾,恐怖袭击,有人卧轨或坠落物品等。 C#地铁站台及出口路径异常检测+文献综述(3):http://www.751com.cn/jisuanji/lunwen_13730.html