截止到2007年底,全国累计发行福利彩票共2760多亿元,筹集福彩公益金达923亿元。这当中,定向用于扶老、助残、救孤、济困等社会福利事业有545亿元,上缴中央财政用来支持其他公益事业的是378亿元,用于补充社会保障基金和其他专项基金以及支持社会福利事业、残疾人保障事业、城乡医疗救助等等公益事业的发展。尤其自2000年之后,福利彩票进入到了迅猛发展时期,2000—2007年,销售福利彩票共2362亿元,筹集公益金达806亿元。
1.2 项目开发的意义
随着我国彩票事业的迅猛发展,彩民想要知道当前一期彩票购买的注数与号码出现次数往往难以实现,。并且当下许多彩票网站或者售点都只是公布出当期彩票的中奖号码,彩民往往需要自己不断记录每期中奖号码,或利用电脑或用纸手绘图表,相当之繁琐。并且还需要自己通过数学运算计算本期哪些号码出现的概率大,非常不方便。然而对于广大的彩民来说,并不是每个人都能完成以上种种繁复的操作,因此很多彩民在购买彩票时往往只能够盲目的购买,亦有许多彩民只想利用购买彩票时利用电脑随机选号碰运气,这些都大大的浪费的彩民手中的资金,并且使他们的希望逐步落空,从而使彩民对彩票事业的信心也逐渐下降,不利于彩票事业的稳步发展。
2 彩票数据采集项目简介
本软件主要为用户提供双色球彩票数据采集以及通过数学运算统计,预测本期号码等功能。本软件主要分为3个层,分别为:解析层、显示层、预测算法层。
一、解析层:
1.系统进行数据采集分为两个方面:
1.1 页面解析:系统发送GET请求,然后返回页面文档,开始进行关键词解析;
1.2 JSON解析:系统发送POST请求,然后返回JSON字符串进行解析;
2.通过以上解析,系统将进行排列组合统计数据,直到采集完成。
二、显示层:
采集完成后,系统将会显示两方面的统计:
1. 显示统计注数:显示采集到的所有注数列表;
2. 显示统计次数:显示采集到的所有号码次数列表;
采集完成后,系统会根据采集到的数据对中奖号码进行本期号码的预测。
三、预测算法层:预测算法是通过对号码使用概率进行分组(分为高概率和低概率两组)。从高概率组里随机抽取2个号码,低概率组里随机抽取4个号码。将随机抽取的号码与采集出的注数数据进行匹配,如果匹配到相同号码,则舍弃,重新抽取随机号码;若没有匹配到相同号码,则得出结果。
3 彩票数据采集使用技术简介
3.1 C#技术
C#(读作:C Sharp)是一种面向对象的、运行于.NET Framework上的高级程序设计语言。C#具有安全,稳定,简单等多种特点,提供对于强类型检查、数组维度检查、未初始化的变量引用检测、自动垃圾收集等软件工程要素的支持。C#与JAVA具有一定的相似度,包括接口、单一继承以及与JAVA差不多同样的编译成中间代码在运行的过程和语法。然而C#与JAVA又有着各自的不同之处,C#模仿了Delphi的特点:与COM(组件对象模型)直接集成,是.NET windows网络框架的主要构成。
C#包含的基本数据类型有:bool、byte、ubyte、short、ushort、int、uint、long、ulong、float、double和decimal。
C#中对于类的申明与JAVA和C++非常类似。然而,不像C++那样,C#中结构体与类是不支持继承的。与JAVA相同之处在于,C#的中,一个结构体是可以实现接口的。C#两个基本类:Object类和String类。Object是所有其他类的基类,而String类是编译器用来保存编写程序时写入的带引号的字符串。