(2)垂直的交易数据
最初的事务数据集是水平的,因为一个交易号唯一标识一串商品码,商品码逐项横向展开。而现在的垂直交易数据库,思想是获取商品出现在哪些交易中,商品码对应的交易号纵向展开,即为垂直。它扫描每个项对应的交易次数,得到支持度,然后判断是否大于最小支持度,得到一频集。连接步骤是两个一频集的交易列表相交不为空且交集大于最小支持度,即得到二频繁集[5],如此迭代下去。
1.2 关联规则
关联分析是数据挖掘技术。关联规则挖掘:在交易数据、关系数据等信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构[6]。关联规则一般用以发现交易数据库中不同商品(项)之间的联系,它描述的是一个事物中物品间同时出现的规律的知识模式,这些规则就是顾客的购买行为模式,现实生活中比如在超市购物时,顾客的消费记录常常隐含着很多关联规则,比如购买牛奶的顾客有55%也买了面包,牛奶=>面包 c=55%就是规则。利用这些规则,商场人员可以很好的规划商品摆放等问题。其主要应用:购物篮分析、交叉销售等。