-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
Hadoop生态系统 版权信息
- ISBN:9787512395985
- 条形码:9787512395985 ; 978-7-5123-9598-5
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
Hadoop生态系统 本书特色
本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。
安全、访问控制和审计。Sentry、Kerberos和Knox。
云计算和虚拟化。Serengeti、Docker和Whirr。信息
Hadoop生态系统 内容简介
如果你的组织即将开始进入大数据的世界,那么可能不仅需要决定Apache Hadoop这个平台是否适合使用,还需要决定Hadoop中哪些组件*适合完成你的任务。本书将帮助你更容易地完成这项工作。本书将Hadoop的生态系统分解为一个个简略的、容易理解的小段内容,以便读者可以快速理解Hadoop项目、子项目及其相关技术是如何一起工作的。
Hadoop生态系统 目录
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11
13 YARN 13
14 Spark 15
第2章数据库及数据管理 17
21 Cassandra 19
22 HBase 21
前言 1 第1章关键技术 7 11 Hadoop分布式文件系统(HDFS) 8 12 MapReduce 11 13 YARN 13 14 Spark 15 第2章数据库及数据管理 17 21 Cassandra 19 22 HBase 21 23 Accumulo 24 24 Memcached 26 25 Blur 28 26 Solr 30 27 MongoDB 32 28 Hive 34 29 Spark SQL ( 前身是 Shark) 36 210 Giraph 38 第3章序列化 41 31 Avro 43 32 JSON 46 33 Protocol Buffers (protobuf) 48 34 Parquet 50 第4章管理与监控 53 41 Ambari 54 42 HCatalog 56 43 Nagios 58 44 Puppet 59 45 Chef 61 46 ZooKeeper 63 47 Oozie 66 48 Ganglia 68 第5章分析辅助 69 51 MapReduce 接口69 52 分析库 70 53 Pig 72 54 Hadoop Streaming 74 55 Mahout 76 56 MLLib 78 57 Hadoop 图像处理接口(HIPI) 80 58 SpatialHadoop 81 第6章数据传输 83 61 Sqoop 85 62 Flume 87 63 DistCp 89 64 Storm 90 第7章安全、访问控制和审计 93 71 Sentry 95 72 Kerberos 97 73 Knox 99 第8章云计算和虚拟化 101 81 Serengeti 103 82 Docker105 83 Whirr 107信息
Hadoop生态系统 作者简介
Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。 Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
- >
我与地坛
我与地坛
¥16.8¥28.0 - >
经典常谈
经典常谈
¥17.1¥39.8 - >
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
¥4.7¥10.0 - >
月亮与六便士
月亮与六便士
¥13.4¥42.0 - >
朝闻道
朝闻道
¥20.2¥23.8 - >
山海经
山海经
¥22.6¥68.0 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥15.9¥49.8 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0
-
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158 -
2022读者节纪念徽章-三星会员专属
¥45¥45.6 -
2023读书月阅读盲盒——我什么场面没见过?
¥42.3¥158 -
2023读书月阅读盲盒——去码头整点什么薯条?
¥42.3¥158