CGFT考试科技模块中是要考《大数据技术原理及应用》和《Python语言基础》,今天我们说说《大数据技术原理及应用》。

大数据是金融科技之源与基介绍数据库和Hadoop大数据生态基本理论,包括设计、存储、查询、管理、挖掘、应用等,初步介绍知识图谱基本概念和应用,掌握SQL语言和正则表达式技能,熟悉常用金融数据库,熟悉金融大数据场景应用

CGFT考试 

服务器Master主要负责表和Region的管理工作。

·管理用户对表的增加、删除、修改、查询等操作。

·实现不同Region服务器之间的负载均衡。

·在Region分裂或合并后,负责重新调整Region的分布。

对发生故障失效的Region服务器上的Region进行迁移。

客户端访问HBase上数据的过程并不需要Master的参与,客户端可以访问Zookeeper获取

-ROOT-表的地址,并*终到达相应的Region服务器进行数据读写,Master仅仅维护着表和Region的元数据信息,因此,负载很低

任何时刻,一个Region只能分配给一个Region服务器Master维护了当前可用的Region服务器列表,以及当前哪些Region分配给了哪些Region服务器,哪些Region还未被分配。当存在未被分配的Region,并且有一个Region服务器上有可用空间时,Master就给这个Region服务器发送一个请求,把该Region分配给它。Region服务器接受请求并完成数据加载后,就开始负责管理该Region对象,并对外提供服务。