输入标题输入二级标题,可根据实际情况删除目录ContentsHBase基础简介HBase集群搭建HBase数据模型HBase相关操作_shell操作HBase相关操作_java编程学习目标LearningObjectives1.能够安装部署HBase集群2.能够理解HBase相关概念(HMaster/HRegionServer、Region、ColumnFamily)3.能够掌握HBase常用shell命令操作4.能够基于HBaseJavaApi编程Hbase基本简介•HBase产生的背景介绍•HBase的基本介绍•HBase的应用场景•Hbase与RDBMS、HDFS、Hive的区别01从1970年开始,大多数的公司数据存储和维护使用的是关系型数据库大数据技术出现后,很多拥有海量数据的公司开始选择像Hadoop的方式来存储海量数据Hadoop使用分布式文件系统HDFS来存储海量数据,并使用MapReduce来处理。Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理但是Hadoop存在的局限:Hadoop主要是实现批量数据的处理,并且通过顺序方式访问数据要查找数据必须搜索整个数据集,如果要进行随机读取数据,效率较低(压根就不支持)总结:HADOOP仅适合存储大批量的数据,进行顺序化读取数据,并不支持随机读取数据操作HBase基础简介HBase产生的背景介绍NoSQL是一个通用术语,泛指一个数据库并不是使用SQL作为主要语言的非关系型数据库HBase是BigTable的开源java版本。是建立在HDFS之上,提供高可靠性、高性能、列存储、可伸缩、实时读写NoSQL的数据库系统HBase仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务主要用来存储结构化和半结构化的松散数据Hbase查询数据功能很简单,不支持join等复杂操作,不支持复杂的事务(行级的事务),从技术上来说,HBase更像是一个「数据存储」而不是「数据库」,因为HBase缺少RDBMS中的许多特性,例如带类型的列、二级索引以及高级查询语言等Hbase中支持的数据类型:byte[]与Hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加存储和处理能力,例如,把集群从10个节点扩展到20个节点,存储能力和处理能力都会加倍HBase中的表一般有这样的特点大:一个表可以有上十亿行,上百万列面向列:面向列(族)的存储和权限控制,列(族)独立检索稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏HBase基础简介Hbase的基本介绍对象存储不少的头条类、新闻类的新闻、网页、图片存储在Hbase之中,一些病毒公司的病毒库也是存储在Hbase中时序数据H...