CGFT大数据中,HBase数据模型是需要重点掌握的。下文是对它的详细介绍,一起随融跃小编卡看吧!
HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳。每个值是一个未经结束的字符串,没有数据类型。
用户在表中存储数据,每一行都有一个可排序行键和任意多的列。表在水平方向由一个或多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起。
列族支持动态扩展,可以很轻松地添加一个列族或列,无需预先定义列的数量以及类型,所有列均以字符串形式存储,用户需要自行进行数据类型转换。
由于同一张表里面的每一行数据都可以有截然不同的列,因此,对于整个映射表的每行数据而言,有些列的值就是空的,所以好HBase是稀疏的。
HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留,HBase可以对允许保留的版本的数量进行设置。客户端可以选择获取距离某个时间zui近的版本,或者一次获取所有版本。
如果在查询的时候不提供时间戳,那么会返回距离现在zui近的那一个版本的数据,因为在存储的时候,数据会按照时间戳排序。
HBase提供了两种数据版本回收方式,一是保存数据的zui后n个版本,而是保存zui近一段时间内的版本。

声明:本文章为学习相关信息展示文章,非课程及服务内容文章,产品及服务详情可咨询网站客服微信。
文章转载须注明来源,文章素材来源于网络,若侵权请与我们联系,我们将及时处理。