北京·BEIJINGPublishingHouseofElectronicsIndustry徐鹏著Hadoop2.XHDFS源码剖析内容简介本书以Hadoop2.6.0源码为基础,深入剖析了HDFS2.X中各个模块的实现细节,包括RPC框架实现、Namenode实现、Datanode实现以及HDFS客户端实现等。本书一共有5章,其中第1章从总体上介绍了HDFS的组件、概念以及典型的流程,同时详细介绍了HDFS各个组件间RPC接口的定义。第2章介绍了HadoopRPC框架的实现,HadoopRPC是HDFS各个组件间通信所依赖的底层框架,可以理解为HDFS的神经系统。第3~5章分别介绍了Namenode、Datanode以及HDFS客户端这三个组件的实现细节,同时穿插介绍了HDFS2.X的新特性,例如NamenodeHA、FederationNamenode等。阅读本书可以帮助读者从架构设计与源码实现角度了解HDFS2.X,同时还能学习HDFS2.X框架中优秀的设计思想、设计模式、Java语言技巧以及编程规范等。这些对于读者全面提高自己的技术水平有很大的帮助。未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。版权所有,侵权必究。图书在版编目(CIP)数据Hadoop2.XHDFS源码剖析/徐鹏著.—北京:电子工业出版社,2016.3ISBN978-7-121-28155-6Ⅰ.①H…Ⅱ.①徐…Ⅲ.①分布式文件系统-研究Ⅳ.①TP316中国版本图书馆CIP数据核字(2016)第027311号策划编辑:张春雨责任编辑:葛娜印刷:三河市双峰印刷装订有限公司装订:三河市双峰印刷装订有限公司出版发行:电子工业出版社北京市海淀区万寿路173信箱邮编:100036开本:787×9801/16印张:35.25字数:879千字版次:2016年3月第1版印次:2016年3月第1次印刷定价:108.00元凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888。质量投诉请发邮件至zlts@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn。服务热线:(010)88258888。献给远老师,愿正年轻的你,永远保持一颗对世界好奇的心。献给我的父母、妹妹,我无法用语言表达对你们的爱,以及你们对这个家庭默默付出的感恩。前言今天Hadoop已经成为大数据处理中十分重要的平台,一个以Hadoop为基础的活跃的开源生态圈已经逐步形成,Hadoop的应用也由最初的互联网行业发展到金融行业、电信行业、IT设备商以及数以万计的中小企业。Hadoop的HDFS组件(Hadoop分布式文件系统)以及MapReduce组件分别为上层框架提供了分布式存储和计算的能力。HDFS作为Hadoop中解决分布式存储的基础组件,最早是根据GFS(...