CGFT考试科技模块中是要考《大数据技术原理及应用》和《Python语言基础》,今天我们说说《大数据技术原理及应用》。
大数据是金融科技之源与基介绍数据库和Hadoop大数据生态基本理论,包括设计、存储、查询、管理、挖掘、应用等,初步介绍知识图谱基本概念和应用,掌握SQL语言和正则表达式技能,熟悉常用金融数据库,熟悉金融大数据场景应用。
主服务器Master主要负责表和Region的管理工作。
·管理用户对表的增加、删除、修改、查询等操作。
·实现不同Region服务器之间的负载均衡。
·在Region分裂或合并后,负责重新调整Region的分布。
对发生故障失效的Region服务器上的Region进行迁移。
客户端访问HBase上数据的过程并不需要Master的参与,客户端可以访问Zookeeper获取
-ROOT-表的地址,并*终到达相应的Region服务器进行数据读写,Master仅仅维护着表和Region的元数据信息,因此,负载很低
任何时刻,一个Region只能分配给一个Region服务器。Master维护了当前可用的Region服务器列表,以及当前哪些Region分配给了哪些Region服务器,哪些Region还未被分配。当存在未被分配的Region,并且有一个Region服务器上有可用空间时,Master就给这个Region服务器发送一个请求,把该Region分配给它。Region服务器接受请求并完成数据加载后,就开始负责管理该Region对象,并对外提供服务。

声明:本文章为学习相关信息展示文章,非课程及服务内容文章,产品及服务详情可咨询网站客服微信。
文章转载须注明来源,文章素材来源于网络,若侵权请与我们联系,我们将及时处理。