今天我们换一个CGFT考试科目知识说一说,我们知道CGFT考试中的科技模块是有两部分组成的,今天我们看看《大数据技术原理及应用》大数据是金融科技之源与基中的Region服务器的工作原理!

CGFT考试

Region服务器HBase中核心的模块,Region服务器内部管理了一系列Region对象和一个HLog文件,其中,HLog是磁盘上面的记录文件,它记录着所有的更新操作。

每个Region对象又是由多个Store组成的,每个Store对应了表中的一个列族的存储。每个Store又包含了一个MemStore和若干个StoreFile,其中,MemStore是在内存中的缓存,保存*近更新的数据,StoreFile是磁盘中的文件,这些文件都是B树结构的,方便快速读取。StoreFile在底层的实现方式是HDFS文件系统的HFile,HFile的数据块通常采用压缩方式存储,压缩之后可以大大减少网络I/O和磁盘I/O