hbase 简介

概述

HBase是一个构建在HDFS上的分布式列存储系统；

HBase是基于GoogleBigTable模型开发的，典型的key/value系统；

HBase是ApacheHadoop生态系统中的重要一员，主要用于海量结构化数据存储；

从逻辑上讲，HBase将数据按照表、行和列进行存储。

与hadoop一样，Hbase目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加计算和存储能力。

Hbase表的特点

大：一个表可以有数十亿行，上百万列；

无模式：每行都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列；

面向列：面向列（族）的存储和权限控制，列（族）独立检索；

稀疏：空（null）列并不占用存储空间，表可以设计的非常稀疏；

数据多版本：每个单元中的数据可以有多个版本，默认情况下版本号自动分配，是单元格插入时的时间戳；

数据类型单一：Hbase中的数据都是字符串，没有类型。

·Hbase数据模型

Hbase逻辑视图

注意上图中的英文说明

Hbase基本概念

RowKey：是Bytearray，是表中每条记录的“主键”，方便快速查找，Rowkey的设计非常重要。
ColumnFamily：列族，拥有一个名称(string)，包含一个或者多个相关列
Column：属于某一个columnfamily，familyName:columnName，每条记录可动态添加
VersionNumber：类型为Long，默认值是系统时间戳，可由用户自定义
Value(Cell)：Bytearray

·Hbase物理模型

每个columnfamily存储在HDFS上的一个单独文件中，空值不会被保存。

Key和 Version number在每个 column family中均有一份；

HBase为每个值维护了多级索引，即：

物理存储:

1、Table中所有行都按照rowkey的字典序排列；

2、Table在行的方向上分割为多个Region；

3、Region按大小分割的，每个表开始只有一个region，随着数据增多，region不断增大，当增大到一个阀值的时候，region就会等分会两个新的region，之后会有越来越多的region；

4、Region是Hbase中分布式存储和负载均衡的最小单元，不同Region分布到不同RegionServer上。

1/3 1 2 3 下一页尾页

hbase 简介

微信编辑器怎么用易点微信编辑器使用教程

井喷：BenQ 8X DVD 刻录机799普及大行动

DVD刻录机存储大革命，革谁的命？

115网盘怎么注册 115网盘注册教程

教你把无法删除的病毒扫地出门

如何防止ASP木马在服务器上运行

求职新利器美图秀秀打造个性“微简历”

美图秀秀新版上线元旦献好礼

图标设计要点--如何准确传达图标的含义

图文教程：R-Studio万能通用数据恢复方法

微信编辑器怎么用易点微信编辑器使用教程

井喷：BenQ 8X DVD 刻录机799普及大行动

DVD刻录机存储大革命，革谁的命？

115网盘怎么注册 115网盘注册教程

教你把无法删除的病毒扫地出门

如何防止ASP木马在服务器上运行

求职新利器美图秀秀打造个性“微简历”

美图秀秀新版上线元旦献好礼

图标设计要点--如何准确传达图标的含义

图文教程：R-Studio万能通用数据恢复方法

hbase 简介

微信编辑器怎么用 易点微信编辑器使用教程

井喷：BenQ 8X DVD 刻录机799普及大行动

DVD刻录机存储大革命，革谁的命？

115网盘怎么注册 115网盘注册教程

教你把无法删除的病毒扫地出门

如何防止ASP木马在服务器上运行

求职新利器 美图秀秀打造个性“微简历”

美图秀秀新版上线元旦献好礼

图标设计要点--如何准确传达图标的含义

图文教程：R-Studio万能通用数据恢复方法

微信编辑器怎么用 易点微信编辑器使用教程

井喷：BenQ 8X DVD 刻录机799普及大行动

DVD刻录机存储大革命，革谁的命？

115网盘怎么注册 115网盘注册教程

教你把无法删除的病毒扫地出门

如何防止ASP木马在服务器上运行

求职新利器 美图秀秀打造个性“微简历”

美图秀秀新版上线元旦献好礼

图标设计要点--如何准确传达图标的含义

图文教程：R-Studio万能通用数据恢复方法

微信编辑器怎么用易点微信编辑器使用教程

求职新利器美图秀秀打造个性“微简历”

微信编辑器怎么用易点微信编辑器使用教程

求职新利器美图秀秀打造个性“微简历”