千家信息网

HBase简介

发表于:2025-11-07 作者:千家信息网编辑
千家信息网最后更新 2025年11月07日,一、简介HBase是基于列存储、构建在HDFS上的分布式存储系统,其主要功能是存储海量结构化数据。HBase构建在HDFS之上,因此HBase也是通过增加廉价的PC机提高系统运行和存储的能力。HBas
千家信息网最后更新 2025年11月07日HBase简介

一、简介

HBase是基于列存储、构建在HDFS上的分布式存储系统,其主要功能是存储海量结构化数据。


HBase构建在HDFS之上,因此HBase也是通过增加廉价的PC机提高系统运行和存储的能力。

HBase中存储的表有如下特点:

1、大表:一个表可以有数十亿行,上百万列;

2、无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;

3、面向列:面向列(族)的存储和权限控制,列(族)独立检索;

4、稀疏:对于空(null)的列,并不占用存储空间,表可以设计的非常稀疏;

5、数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳;

6、数据类型单一:Hbase中的数据都是字符串,没有类型。


二、hbase的适用场景

1、存在高并发读写

2、表结构的列族经常需要调整

3、存储结构化或半结构化数据

4、高并发的key-value存储

5、key随机写入,有序存储

6、针对每个key保存一个固定大小的集合 多版本

同样hbase数据也存在不适用的场景

1、由于hbase只能提供行锁,它对分布式事务支持不好

2、对于查询操作中的join、group by 性能很差

3、查询如果不使用row-key查询,性能会很差,因为此时会进行全表扫描,建立二级索引或多级索引需要同时维护一张索引表

4、高并发的随机读支持有限

三、hbase基本架构及组件说明

由上图可知,hbase包括Clinet、HMaster、HRegionServer、ZooKeeper组件

各组件功能介绍:

1、Client

Client主要通过ZooKeeper与Hbaser和HRegionServer通信,对于管理操作:client向master发起请求,对于数据读写操作:client向regionserver发起请求

2、ZooKeeper

zk负责存储_root_表的地址,也负责存储当前服务的master地址,regsion server也会将自身的信息注册到zk中,以便master能够感知region server的状态,zk也会协调active master,也就是可以提供一个选举master leader,也会协调各个region server的容灾流程

3、HMaster

master可以启动多个master,master主要负责table和region的管理工作,响应用户对表的CRUD操作,管理region server的负载均衡,调整region 的分布和分配,当region server停机后,负责对失效的regionn进行迁移操作

4、HRegionServer

region server主要负责响应用户的IO请求,并把IO请求转换为读写HDFS的操作


存储 数据 版本 结构 索引 组件 查询 管理 结构化 不同 稀疏 分布式 功能 单元 地址 场景 多个 性能 用户 类型 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 高港区多功能网络技术市场 连接数据库间歇性失败 计算机网络技术十五篇周报 湖湘杯网络安全大赛的含金量 dede数据库加密方式 软件开发假学历 数据库学哪个好用 方舟生存进化服务器如何自己建 R7服务器6核12 澳大利亚网络安全数据 mc空岛服务器怎么弄 SEO网络技术服务 数据库制作的软件有哪些内容 鹿泉区信息化软件开发专业服务 sci影响因子查询数据库 北理工网络安全学院大牛 服务器安全狗如何添加端口 微创中国网络技术股份有限公司 ftp服务器提供文件的两种功能 普陀区大型软件开发厂家价格 软件开发合同首款集成 黑客与网络技术的关系 西安金钱河网络技术 网课期间的网络安全 辽宁综合软件开发配件 天津编译分布式存储服务器 科蓝软件开发怎么样 举例说明数据库断言的意义 中国东盟文化数据库的建立 江西实用软件开发代理品牌
0