2013-04-09 2215.47 2225.77 14.18 0.64% 2215.47 2234.73 82896544 7313504.00
2013-04-08 2196.24 2211.59 -13.70 -0.62% 2180.67 2212.59 86257472 7366616.50
2013-04-03 2232.69 2225.29 -2.44 -0.11% 2217.25 2241.34 81795264 6880135.50
2013-04-02 2234.90 2227.74 -6.66 -0.30% 2220.44 2253.42 89714320 7759666.50
2013-04-01 2229.46 2234.40 -2.23 -0.10% 2227.31 2243.95 77411776 6699753.50
表2:课题选择的证券数据
通过XML标记语言存储的这10组数据其具体代码为:
<?xml version="1.0" encoding="GB2312" ?>
<上证指数>
<证券数据>
<日期>2013/04/01</日期>
<开盘>2229.46</开盘>
<收盘>2234.4</收盘>
<最低>2227.31</最低>
<最高>2243.95</最高>
<成交量>77411776</成交量>
<成交金额>6699753.5</成交金额>
</证券数据>
……
<证券数据>
<日期>2013/04/16</日期>
<开盘>2169.63</开盘>
<收盘>2194.85</收盘>
<最低>2165.78</最低>
<最高>2196.43</最高>
<成交量>79992176</成交量>
<成交金额>6695584.5</成交金额>
</证券数据>
</上证指数>
而最终参与运算的这些数据都通过预先的预处理,最终参与数据运算的数据其具体代码为:
<?xml version="1.0" encoding="GB2312" ?>
<标准化数据>
<证券数据>
<编号>1</编号>
<开盘>0.8883</开盘>
<收盘>1</收盘>
<最低>1</最低>
<最高>0.8338</最高>
<成交量>0.4620</成交量>
<成交金额>0.5047</成交金额>
</证券数据>
……
<证券数据>
<编号>10</编号>
<开盘>0</开盘>
<收盘>0.2461</收盘>
<最低>0</最低>
<最高>0</最高>
<成交量>0.5749</成交量>
<成交金额>0.5028</成交金额>
</证券数据>
</标准化数据>
这里的标准化处理的算法过程将会在第三章详细说明,再次不再赘述。
时间节点证券数据相似度算法的分析与运算
数据的预处理
数据的选择
本课题研究的主要是以时间为单位的证券数据的相似度,在选择数据的时候需要考虑几点: 以时间为单位的证券相似度的研究+文献综述(5):http://www.751com.cn/shuxue/lunwen_2994.html