hbase 简介

2019-01-16 23:07:02王冬梅

RegionServer容错:定时向Zookeeper汇报心跳,如果一旦时间内未出现心跳,Master将该RegionServer上的Region重新分配

到其他RegionServer上,失效服务器上“预写”日志由主服务器进行分割并派送给新的RegionServer

Zookeeper容错:Zookeeper是一个可靠地服务,一般配置3或5个Zookeeper实例

Region定位流程:




寻找RegionServer

ZooKeeper-->-ROOT-(单Region)-->.META.-->用户表

-ROOT-

ü表包含.META.表所在的region列表,该表只会有一个Region;

üZookeeper中记录了-ROOT-表的location。

.META.

ü表包含所有的用户空间region列表,以及RegionServer的服务器地址。

·Hbase使用场景

storing large amounts of data(100s ofTBs) needhigh write throughput needefficient random access(key lookups) within large datasets needto scale gracefully with data forstructured and semi-structured data don'tneed fullRDMS capabilities(cross row/cross table transaction,joins,etc.)

大数据量存储,大数据量高并发操作

需要对数据随机读写操作

读写访问均是非常简单的操作

·Hbase与HDFS对比

两者都具有良好的容错性和扩展性,都可以扩展到成百上千个节点;

HDFS适合批处理场景

不支持数据随机查找

不适合增量数据处理

不支持数据更新



您可能感兴趣的文章:

深入浅析hbase的优点详解hbase与hive数据同步python操作 hbase 数据的方法shell 命令行中操作HBase数据库实例详解Asp.Net Couchbase Memcached图文安装调用开发基于HBase Thrift接口的一些使用问题及相关注意事项的详解hbase shell基础和常用命令详解