图书介绍

HBase实战【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

HBase实战
  • (美)NickDimidukAmandeepKhurana著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:7115324467
  • 出版时间:2013
  • 标注页数:315页
  • 文件大小:73MB
  • 文件页数:340页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

HBase实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 HBase基础3

第1章 HBase介绍3

1.1数据管理系统:速成4

1.1.1你好,大数据5

1.1.2数据创新6

1.1.3 HBase的崛起7

1.2 HBase使用场景和成功案例8

1.2.1典型互联网搜索问题:BigTable发明的原因8

1.2.2抓取增量数据9

1.2.3内容服务12

1.2.4信息交换13

1.3你好HBase14

1.3.1快速安装14

1.3.2 HBase Shell命令行交互16

1.3.3存储数据17

1.4小结18

第2章 入门20

2.1从头开始21

2.1.1创建表21

2.1.2检查表模式22

2.1.3建立连接22

2.1.4连接管理23

2.2数据操作23

2.2.1存储数据24

2.2.2修改数据25

2.2.3工作机制:HBase写路径25

2.2.4读数据26

2.2.5工作机制:HBase读路径27

2.2.6删除数据28

2.2.7合并:HBase的后台工作28

2.2.8有时间版本的数据29

2.2.9数据模型概括30

2.3数据坐标31

2.4小结33

2.5数据模型37

2.5.1逻辑模型:有序映射的映射集合37

2.5.2物理模型:面向列族39

2.6表扫描40

2.6.1设计用于扫描的表41

2.6.2执行扫描42

2.6.3扫描器缓存43

2.6.4使用过滤器43

2.7原子操作44

2.8 ACID语义45

2.9小结46

第3章 分布式的HBase、 HDFS和MapReduce48

3.1 一个MapReduce的例子49

3.1.1延迟与吞吐量49

3.1.2串行计算吞吐量有限50

3.1.3并行计算提高吞吐量50

3.1.4 MapReduce:用布式计算最大化吞吐量51

3.2 Hadoop MapReduce概览52

3.2.1 MapReduce数据流介绍53

3.2.2 MapReduce内部机制57

3.3分布式模式的HBase58

3.3.1切分和分配大表58

3.3.2如何找到region61

3.3.3如何找到-ROOT-表62

3.4 HBase和MapReduce64

3.4.1使用HBase作为数据源64

3.4.2使用HBase接收数据66

3.4.3使用HBase共享资源67

3.5信息汇总71

3.5.1编写MapReduce应用72

3.5.2运行MapReduce应用73

3.6大规模条件下的可用性和可靠性74

3.6.1 HDFS作为底层存储75

3.7小结77

第二部分 高级概念81

第4章 HBase表设计81

4.1如何开始模式设计82

4.1.1问题建模82

4.1.2需求定义:提前多做准备工作总是有好处的84

4.1.3均衡分布数据和负载的建模方法87

4.1.4目标数据访问93

4.2反规范化是HBase世界里的词语95

4.3相同表里的混杂数据97

4.4行键设计策略98

4.5 IO考虑99

4.5.1为写优化99

4.5.2为读优化101

4.5.3基数和行键结构101

4.6从关系型到非关系型102

4.6.1一些基本概念103

4.6.2嵌套实体105

4.6.3没有映射到的一些东西106

4.7列族高级配置107

4.7.1可配置的数据块大小107

4.7.2数据块缓存108

4.7.3激进缓存108

4.7.4布隆过滤器108

4.7.5生存时间(TTL)109

4.7.6压缩110

4.7.7单元时间版本110

4.8过滤数据111

4.8.1实现一个过滤器113

4.8.2预装过滤器115

4.9小结118

第5章 使用协处理器扩展HBase120

5.1两种协处理器121

5.1.1 Observer协处理器121

5.1.2 endpoint协处理器123

5.2实现一个observer124

5.2.1修改模式124

5.2.2从HBase开始126

5.2.3安装observer128

5.2.4其他安装选项130

5.3实现一个endpoint131

5.3.1为endpoint定义接口131

5.3.2实现endpoint服务器132

5.3.3实现endpoint客户端133

5.3.4部署endpoint服务器135

5.3.5试运行136

5.4小结136

第6章 其他的HBase客户端选择137

6.1在UNIX里使用HBasehell脚本138

6.1.1准备HBase Shell138

6.1.2使用UNIX Shell脚本创建表模式139

6.2使用JRuby进行HBase Shell编程141

6.2.1准备HBase Shell141

6.2.2访问TwitBase的users表142

6.3通过REST访问HBase144

6.3.1启动HBase REST 服务145

6.3.2访问TwitBase的users表146

6.4通过Python使用HBaseThrift网关149

6.4.1生成Python语言的HBaseThrift客户端库151

6.4.2启动HBase Thrift服务152

6.4.3扫描TwitBaseuser表153

6.5 asynchbase:另外一种HBase Java客户端156

6.5.1创建一个asynchbase项目157

6.5.2改变TwitBase的密码策略159

6.5.3试运行171

6.6小结172

第三部分 应用系统实例175

第7章 通过实例学习HBase:OpenTSDB175

7.1 OpenTSDB概述176

7.1.1挑战:基础设施监控177

7.1.2数据:时间序列178

7.1.3存储:HBase179

7.2设计一个HBase应用系统180

7.2.1模式设计180

7.2.2应用架构184

7.3实现一个HBase应用系统187

7.3.1存储数据187

7.3.2查询数据192

7.4小结196

第8章 在HBase上查询地理信息系统197

8.1运用地理数据197

8.2设计一个空间索引199

8.2.1从复合行键开始201

8.2.2介绍geohash202

8.2.3理解geohash205

8.2.4在有空间感知特性的行键里使用geohash206

8.3实现最近邻居查询210

8.4把计算工作推往服务器端215

8.4.1基于查询多边形创建一次geohash扫描217

8.4.2区域内查询第一幕:客户端222

8.4.3区域内查询第二幕:WithinFilter224

8.5小结228

第四部 分让HBase运转来233

第9章 部署HBase233

9.1规划集群234

9.1.1原型集群235

9.1.2 小型生产集群(10~20台服务器)235

9.1.3中型生产集群(50台以下服务器)236

9.1.4大型生产集群(超过50台服务器)237

9.1.5 Hadoop Master节点237

9.1.6 HBase Master238

9.1.7 Hadoop DataNode和HBase RegionServer238

9.1.8 ZooKeeper239

9.1.9采用云服务怎么样?240

9.2部署软件242

9.2.1 Whirr:在云端部署242

9.3发行版本244

9.3.1使用原生Apache发行版本244

9.3.2使用Cloudera的CDH发行版本245

9.4配置246

9.4.1 HBase配置246

9.4.2与HBase有关的Hadoop配置参数252

9.4.3操作系统配置253

9.5管理守护进程254

9.6小结255

第10章 运维256

10.1监控你的集群257

10.1.1 HBase如何输出监控指标257

10.1.2收集监控指标和图形展示258

10.1.3 HBase输出的监控指标260

10.1.4应用端监控264

10.2 HBase集群的性能265

10.2.1性能测试265

10.2.2什么影响了HBase的性能268

10.2.3优化支撑系统269

10.2.4优化HBase270

10.3集群管理274

10.3.1启动和停止HBase274

10.3.2优雅停止和让节点退役275

10.3.3增加节点276

10.3.4滚动重启和升级276

10.3.5 bin/hbase和Hbase Shell277

10.3.6维护一致性——hbck283

10.3.7查看HFile和HLog286

10.3.8预先拆分表288

10.4备份和复制290

10.4.1集群间复制290

10.4.2使用MapReduce作业进行备份294

10.4.3备份根目录298

10.5小结299

附录A探索HBase系统300

附录B更多关于HDFS的工作原理307

热门推荐