中文名: Hadoop權威指南(中文版)
原名: Hadoop: The Definitive Guide
作者: Tom White
譯者: 周傲英
曾大聃
圖書分類: 軟件
資源格式: PDF
版本: 掃描版
出版社: 清華大學出版社
書號: ISBN: 9787302224242
發行時間: 2010年05月01日
地區: 大陸
語言: 簡體中文
簡介:
內容簡介 本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(谷歌)開創其帝國的重要基石。本書內容豐富,展示了如何使用Hadoop構建可靠、可伸縮的分布式系統,程序員可從中探索如何分析海量數據集,管理員可以了解如何建立與運行Hadoop集群。
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件系統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式系統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方面最全面的參考。
內容截圖目錄:
第1章 初識Hadoop
第2章 MapReduce簡介
第3章 Hadoop分布式文件系統
第4章 Hadoop的I/O
第5章 MapReduce應用開發
第6章 MapReduce的工作原理
第7章 MapReduce的類型與格式
第8章 MapReduce特性
第9章 Hadoop集群的安裝
第10章 Hadoop的管理
第11章 Pig簡介
第12章 Hbase簡介
第13章 ZooKeeper簡介
第14章 案例研究
附錄A Apache Hadoop的安裝
附錄B Cloudera的Hadoop分發包
附錄C 預備NCDC氣象資料