图2 Hadoop EcoSystem存储层
上图2所示,展示了Hadoop Ecosystem的每一层系统,[1]HBASE在结构化存储层,看图片我们可以看出来,每一层都为HB提供了其所需要的各种支持,例如:Hadoop HDFS提升了其在最下一层的保存, Hadoop Maprcduce提升了它的计算功能等等。另外,在语言方面,其拥有的Pig和Hive使得在其上行信息整合处理变的如此简单。Sqoop则提升了它的信息导入能力,这有利于以前的信息转至它的数据库中。
1.2 HBASE数据模型
HBASE的数据是松散数据,所谓松散数据说白了就是不仅仅是一把钥匙对应一把锁,很可能一把钥匙对应多个锁,因为你要保存的不仅仅是单个属性的信息结构,但是与之前的信息库相比它的关联关系没有从前的信息库那么多。我们还可以把它看做是一个映射表,此表的引擎是每一行主要的字,每一列主要的字和时间戳记。每一行主要的字就是所谓的关键词,它是要搜索对象在每一行的仅有的特征。时间戳记就是每当数据存入的时候都会有一个时间记录。人们在表中储存信息,都会有主键和列。因为是松散的数据,所以在一张表里的每一行信息都可存在千差万别的列。列主要字解释为“<列簇>:<列标签>”,它们两个是包含和被包含的关系,列簇之下有不止一个列标签,通过它们俩就可以确定一个信息的存储列,而且是唯一的。 基于HBASE的测试方法研究(2):http://www.751com.cn/jisuanji/lunwen_36828.html