【java电子书】Spark最佳实践 高清晰 PDF 电子书 百度云 百度网盘下载
java自学网(www.javazx.com)-java论坛,java电子书推荐:《Spark最佳实践 》java电子书推荐理由:腾讯专家传授实战经验,通过实战项目介绍Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。
作者:陈欢 林世飞
出版社:人民邮电出版社
出版时间:2016年05月
java电子书目录:
第1章 Spark与大数据 11.1 大数据的发展及现状 11.1.1 大数据时代所面临的问题 11.1.2 谷歌的大数据解决方案 21.1.3 Hadoop生态系统 31.2 Spark应时而生 41.2.1 Spark的起源 41.2.2 Spark的特点 51.2.3 Spark的未来发展 6第2章 Spark基础 82.1 Spark本地单机模式体验 82.1.1 安装虚拟机 82.1.2 安装JDK 192.1.3 下载Spark预编译包 212.1.4 本地体验Spark 222.2 高可用Spark分布式集群部署 252.2.1 集群总览 262.2.2 集群机器的型号选择 282.2.3 初始化集群机器环境 292.2.4 部署ZooKeeper集群 332.2.5 编译Spark 352.2.6 部署Spark Standalone集群 372.2.7 高可用Hadoop集群 402.2.8 让Spark运行在YARN上 402.2.9 一键部署高可用Hadoop Spark集群 422.3 Spark编程指南 432.3.1 交互式编程 432.3.2 RDD创建 442.3.3 RDD操作 472.3.4 使用其他语言开发Spark程序 542.4 打包和提交 542.4.1 编译、链接、打包 542.4.2 提交 56第3章 Spark工作机制 583.1 调度管理 583.1.1 集群概述及名词解释 583.1.2 Spark程序之间的调度 603.1.3 Spark程序内部的调度 633.2 内存管理 653.2.1 RDD持久化 653.2.2 共享变量 663.3 容错机制 673.3.1 容错体系概述 673.3.2 Master节点失效 683.3.3 Slave节点失效 693.4 监控管理 693.4.1 Web界面 693.4.2 REST API 723.4.3 Metrics指标体系 733.4.4 其他监控工具 733.5 Spark程序配置管理 733.5.1 Spark程序配置加载过程 743.5.2 环境变量配置 743.5.3 Spark属性项配置 743.5.4 查看当前的配置 763.5.5 配置Spark日志 76第4章 Spark内核讲解 774.1 Spark核心数据结构RDD 774.1.1 RDD的定义 784.1.2 RDD的Transformation 804.1.3 RDD的Action 824.1.4 Shuffle 834.2 SparkContext 844.2.1 SparkConf配置 844.2.2 初始化过程 854.2.3 其他功能接口 874.3 DAG调度 874.3.1 DAGScheduler 874.3.2 TaskScheduler 90第5章 Spark SQL与数据仓库 925.1 Spark SQL基础 935.1.1 分布式SQL引擎 935.1.2 支持的SQL语法 975.1.3 支持的数据类型 985.1.4 DataFrame 995.1.5 DataFrame数据源 1035.1.6 性能调优 1045.2 Spark SQL原理和运行机制 1045.2.1 Spark SQL整体架构 1055.2.2 Catalyst执行优化器 1055.3 应用场景:基于淘宝数据建立电商数据仓库 1105.3.1 电商数据仓库场景 1115.3.2 数据准备和表设计 1115.3.3 用Spark SQL来完成日常运营数据分析 1155.3.4 Spark SQL在大规模数据下的性能表现 120第6章 Spark流式计算 1226.1 Spark Streaming基础知识 1236.1.1 入门简单示例 1236.1.2 基本概念 1246.1.3 高级操作 1296.2 深入理解Spark Streaming 1326.2.1 DStream的两类操作 1326.2.2 容错处理 1346.2.3 性能调优 1366.2.4 与Storm的对比 1376.3 应用场景:一个类似百度统计的流式实时系统 1396.3.1 Web log实时统计场景 1396.3.2 日志实时采集 1406.3.3 流式分析系统实现 140第7章 Spark图计算 1497.1 什么是图计算 1497.1.1 图的基本概念 1497.1.2 图计算的应用 1507.2 Spark GraphX简介 1517.2.1 GraphX实现 1517.2.2 GraphX常用API介绍 1527.3 应用场景:基于新浪微博数据的社交网络分析 1537.3.1 社交网络分析的主要应用 1537.3.2 社区发现算法简介 1547.3.3 用GraphX实现Louvain算法 1567.3.4 小试牛刀:谁是你的闺蜜 1627.3.5 真实的场景:新浪微博关系分析 164第8章 Spark MLlib 1698.1 机器学习简介 1698.1.1 什么是机器学习 1698.1.2 机器学习示例 1718.1.3 机器学习的基本方法 1728.1.4 机器学习的常见技巧 1738.1.5 机器学习参考资料 1748.2 MLlib库简介 1748.2.1 基础数据类型 1748.2.2 主要的库 1758.2.3 附带的示例程序 1768.3 应用场景:搜索广告点击率预估系统 1788.3.1 应用场景 1788.3.2 逻辑回归 1798.3.3 学习算法 1818.3.4 模型评估 1848.3.5 数据准备 1868.3.6 模型训练 1878.3.7 模型调优 195附录 Scala语言参考 197
百度网盘下载地址链接(百度云):java自学网(javazx.com)Spark最佳实践PDF 高清 电子书 百度云.rar【密码回帖可见】
**** Hidden Message *****
补哦错啊 !!!! 看看 学习了 1111111111111111111111111111 ASDADASDDDDDDDDDDDDD 感谢分享,好好学习!!! 下来学习,谢谢 谢谢楼主分享谢谢谢谢 java自学网给力 亲测资源可以 不错的资源收下了谢谢楼主