hbase shell基础和常用命令详解

HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。

1. 简介

HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。

2. HBase的表结构

HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族/列簇(column family)。

Row Key	column-family1		column-family2			column-family3
Row Key	column1	column2	column1	column2	column3	column1
key1
key2
key3

如上图所示，key1,key2,key3是三条记录的唯一的row key值，column-family1,column-family2,column-family3是三个列族，每个列族下又包括几列。比如column-family1这个列族下包括两列，名字是column1和column2，t1:abc,t2:gdxdf是由row key1和column-family1-column1唯一确定的一个单元cell。这个cell中有两个数据，abc和gdxdf。两个值的时间戳不一样，分别是t1,t2, hbase会返回最新时间的值给请求者。

这些名词的具体含义如下：

(1) Row Key

与nosql数据库们一样,row key是用来检索记录的主键。访问hbase table中的行，只有三种方式：

(1.1) 通过单个row key访问

(1.2) 通过row key的range

(1.3) 全表扫描

Row key行键 (Row key)可以是任意字符串(最大长度是 64KB，实际应用中长度一般为 10-100bytes)，在hbase内部，row key保存为字节数组。

存储时，数据按照Row key的字典序(byte order)排序存储。设计key时，要充分排序存储这个特性，将经常一起读取的行存储放到一起。(位置相关性)

注意：

字典序对int排序的结果是1,10,100,11,12,13,14,15,16,17,18,19,2,20,21,…,9,91,92,93,94,95,96,97,98,99。要保持整形的自然序，行键必须用0作左填充。

行的一次读写是原子操作 (不论一次读写多少列)。这个设计决策能够使用户很容易的理解程序在对同一个行进行并发更新操作时的行为。

(2) 列族 column family

hbase表中的每个列，都归属与某个列族。列族是表的chema的一部分(而列不是)，必须在使用表之前定义。列名都以列族作为前缀。例如courses:history ， courses:math 都属于 courses 这个列族。

访问控制、磁盘和内存的使用统计都是在列族层面进行的。实际应用中，列族上的控制权限能帮助我们管理不同类型的应用：我们允许一些应用可以添加新的基本数据、一些应用可以读取基本数据并创建继承的列族、一些应用则只允许浏览数据（甚至可能因为隐私的原因不能浏览所有数据）。

1/5 1 2 3 4 5 下一页尾页

hbase shell基础和常用命令详解

linux rename 批量修改文件名的操作方法

百度钱包怎么绑定银行卡百度钱包添加银行卡教程

云之家怎么使用公共服务平台云之家公共服务平台使

linux执行sh脚本报错：$’\r’:未找到命令的完美解决方

bash脚本截取字符串的两种方法

让系统默认支持rar压缩文件方法

YUMMY教你做美图之炫彩背景篇

宅人社交新工具美图看看一键上传微博、人人网

MHDD4.6使用方法图解

百度杀毒软件怎么用

linux rename 批量修改文件名的操作方法

百度钱包怎么绑定银行卡百度钱包添加银行卡教程

云之家怎么使用公共服务平台云之家公共服务平台使

linux执行sh脚本报错：$’\r’:未找到命令的完美解决方

bash脚本截取字符串的两种方法

让系统默认支持rar压缩文件方法

YUMMY教你做美图之炫彩背景篇

宅人社交新工具美图看看一键上传微博、人人网

MHDD4.6使用方法图解

百度杀毒软件怎么用

hbase shell基础和常用命令详解

linux rename 批量修改文件名的操作方法

百度钱包怎么绑定银行卡 百度钱包添加银行卡教程

云之家怎么使用公共服务平台 云之家公共服务平台使

linux执行sh脚本报错：$’\r’:未找到命令的完美解决方

bash脚本截取字符串的两种方法

让系统默认支持rar压缩文件方法

YUMMY教你做美图之炫彩背景篇

宅人社交新工具 美图看看一键上传微博、人人网

MHDD4.6使用方法图解

百度杀毒软件怎么用

linux rename 批量修改文件名的操作方法

百度钱包怎么绑定银行卡 百度钱包添加银行卡教程

云之家怎么使用公共服务平台 云之家公共服务平台使

linux执行sh脚本报错：$’\r’:未找到命令的完美解决方

bash脚本截取字符串的两种方法

让系统默认支持rar压缩文件方法

YUMMY教你做美图之炫彩背景篇

宅人社交新工具 美图看看一键上传微博、人人网

MHDD4.6使用方法图解

百度杀毒软件怎么用

百度钱包怎么绑定银行卡百度钱包添加银行卡教程

云之家怎么使用公共服务平台云之家公共服务平台使

宅人社交新工具美图看看一键上传微博、人人网

百度钱包怎么绑定银行卡百度钱包添加银行卡教程

云之家怎么使用公共服务平台云之家公共服务平台使

宅人社交新工具美图看看一键上传微博、人人网