
apache spark源码剖析(许鹏著)
pdf版高清完整版- 软件大小:30.9 MB
- 更新日期:2018-06-26
- 软件语言:简体中文
- 软件类别:电子文档
- 软件授权:免费软件
- 软件官网:未知
- 适用平台:WinXP, Win7, Win8, Win10, WinAll
- 软件厂商:
软件介绍人气软件相关文章网友评论下载地址
apache spark源码剖析提供了详细的代码分析方式,作者利用自己多年的开发经验以及对编程方式的理解,将apache spark源码的使用方式以及布局方式编辑到书籍上,让读者可以通过阅读内容加深代码的使用技巧,并且可以避免多种代码使用的误区;apache spark源码剖析第1章和第2章简要介绍了大数据分析技术的产生背景和演进过程:第3~5章详细分析了 Spark Core中的作业规划、提交及任务执行等内容,对于要深刻把握Spark实现机理的读者来说,这几章值得反复阅读;第6~9章就Spak提供的高级Lib库进行了简要的分析,分析的思路是解决的主要问题是什么、解决的方案是如何产生的,以及方案是如何通过代码来具体实现的,通过九个章节的学习,可以让您在规划新项目的时候更快、更稳定,对于需要学习源代码编程以及需要开发spark程序的朋友有很大的帮助!

前言
笔者是以读 Spark论文开始的,说老实话觉得晦涩难懂,因为无法将其映射到内存使用、进程启动、线程运行、消息传递等基本问题上。或许换个方法会更好,故笔者选择直接从源码入手,如此一来事情反而变简单了。在源码分析的过程中,笔者始终抓住资源分配、消息传递、容错处理等基本问题设问,然后一步步努力寻找答案,所有的问题渐渐迎刃而解。
阅读方式
1、apache spark源码剖析是以文档的方式保存在电脑
2、下载双击书籍名字就可以查看里面的内容
3、如果是win10,可以选择Microsoft Edge浏览器打开
4、也可以下载金山pdf阅读器打开
5、可以在河东网站搜索一款的皮肤阅读器下载使用

目录
第一部分 Spark概述
第1章 初识Spark
1.1 大数据和Spark
1.1.1 大数据的由来
1.1.2 大数据的分析
1.1.3 Hadoop
1.1.4 Spark简介
1.2 与Spark的第一次亲密接触
1.2.1 环境准备
1.2.2 下载安装Spark
1.2.3 Spark下的WordCount
第二部分 Spark核心概念
第2章 Spark整体框架
2.1 编程模型
2.1.1 RDD
2.1.2 Operation
2.2 运行框架
2.2.1 作业提交
2.2.2 集群的节点构成
2.2.3 容错处理
2.2.4 为什么是Scala
2.3 源码阅读环境准备
2.3.1 源码下载及编译
2.3.2 源码目录结构
2.3.3 源码阅读工具
2.3.4 本章小结
第3章 SparkContext初始化
3.1 spark-shell
3.2 SparkContext的初始化综述
3.3 Spark Repl综述
3.3.1 Scala Repl执行过程
3.3.2 Spark Repl
第4章 Spark作业提交
4.1 作业提交
4.2 作业执行
4.2.1 依赖性分析及Stage划分
4.2.2 Actor Model和Akka
4.2.3 任务的创建和分发
4.2.4 任务执行
4.2.5 Checkpoint和Cache
4.2.6 WebUI和Metrics
4.3 存储机制
4.3.1 Shuffle结果的写入和读取
4.3.2 Memory Store
4.3.3 存储子模块启动过程分析
4.3.4 数据写入过程分析
4.3.5 数据读取过程分析
4.3.6 TachyonStore
第5章 部署方式分析
5.1 部署模型
5.2 单机模式local
5.3 伪集群部署local-cluster
5.4 原生集群Standalone Cluster
5.4.1 启动Master
5.4.2 启动Worker
5.4.3 运行spark-shell
5.4.4 容错性分析
5.5 Spark On YARN
5.5.1 YARN的编程模型
5.5.2 YARN中的作业提交
5.5.3 Spark On YARN实现详解
5.5.4 SparkPi on YARN
第三部分 Spark Lib
第6章 Spark Streaming
6.1 Spark Streaming整体架构
6.1.1 DStream
6.1.2 编程接口
6.1.3 Streaming WordCount
6.2 Spark Streaming执行过程
6.2.1 StreamingContext初始化过程
6.2.2 数据接收
6.2.3 数据处理
6.2.4 BlockRDD
6.3 窗口操作
6.4 容错性分析
6.5 Spark Streaming vs. Storm
6.5.1 Storm简介
6.5.2 Storm和Spark Streaming对比
6.6 应用举例
6.6.1 搭建Kafka Cluster
6.6.2 KafkaWordCount 第7章 SQL
7.1 SQL语句的通用执行过程分析
7.2 SQL On Spark的实现分析
7.2.1 SqlParser
7.2.2 Analyzer
7.2.3 Optimizer
7.2.4 SparkPlan
7.3 Parquet 文件和JSON数据集
7.4 Hive简介
7.4.1 Hive 架构
7.4.2 HiveQL On MapReduce执行过程分析
7.5 HiveQL On Spark详解
7.5.1 Hive On Spark环境搭建
7.5.2 编译支持Hadoop 2.x的Spark
7.5.3 运行Hive On Spark测试用例

第8章 GraphX
8.1 GraphX简介
8.1.1 主要特点
8.1.2 版本演化
8.1.3 应用场景
8.2 分布式图计算处理技术介绍
8.2.1 属性图
8.2.2 图数据的存储与分割
8.3 Pregel计算模型
8.3.1 BSP
8.3.2 像顶点一样思考
8.4 GraphX图计算框架实现分析
8.4.1 基本概念
8.4.2 图的加载与构建
8.4.3 图数据存储与分割
8.4.4 操作接口
8.4.5 Pregel在GraphX中的源码实现
8.5 PageRank
8.5.1 什么是PageRank
8.5.2 PageRank核心思想
第9章 MLLib
9.1 线性回归
9.1.1 数据和估计
9.1.2 线性回归参数求解方法
9.1.3 正则化
9.2 线性回归的代码实现
9.2.1 简单示例
9.2.2 入口函数train
9.2.3 最优化算法optimizer
9.2.4 权重更新update
9.2.5 结果预测predict
9.3 分类算法
9.3.1 逻辑回归
9.3.2 支持向量机
9.4 拟牛顿法
9.4.1 数学原理
9.4.2 代码实现
9.5 MLLib与其他应用模块间的整合
电子版本优势
1、下载apache spark源码剖析放到电脑上阅读
2、不需要到书店购买书籍
3、可以发送到任意电脑上阅读
4、也可以传输到手机上随时阅读
5、文字内容以及代码内容都是可以放大的
6、可以参考作者提供的开发代码编译
学习方式
Spark源码采用 Scala语言编写,那么阅读Sprk源码之前,是否一定要先学 Scala呢?笔者个人以为不必,只要你有一些Java或C++编程语言的基础,就可以开始看 Spark源码,遇到不懂的地方再去学习,效率反而会大大提高,做有的放矢。将学习中遇到的知识点,从函数式编程、泛型编程、面向对象、并行编程等几个方面整理归纳,这样能够快速将 Scala语言的框架勾勒出来。
第四部分 附录
附录A Spark源码调试
附录B 源码阅读技巧
版权说明
图书在版编目(CIP)数据
Apache Spark源码剖析/许鹏著一北京:电子工业出版社,2015.3
ISBN978-7-121-25420-8
I.①A…II.①许…III.①互联网络一网络服务器②数据处理软件IV.①TP368.5②TPZ
中国版本图书馆CIP数据核字(2015)第010897号

策划编辑:付睿
责任编辑:李云静
印刷:北京天来印务有限公司
装订:北京天来印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:787×9801/16印张:18.5字数:432千字
版次:2015年3月第1版
印次:2015年3月第1次印刷
定价:68.00元
下载地址
-
apache spark源码剖析(许鹏著) pdf版高清完整版
其他版本下载
- 查看详情数科阅读器(OFD阅读器) 2.0.18.0419 官方版20.77 MB简体中文18-09-26
- 查看详情netty实战(带书签目录) pdf高清中文版12.9 MB简体中文18-01-31
- 查看详情人月神话(32周年中文纪念版) pdf高清晰完整版30.3 MB简体中文18-04-21
- 查看详情数据结构c++第3版(邓俊辉著) pdf高清扫描完整版19.3 MB简体中文18-05-02
- 查看详情正则表达式必知必会修订版 带书签 pdf高清版13.4 MB简体中文18-01-26
- 查看详情程序员的自我修养-链接、装载与库(潘爱民著) pdf 清晰扫描版29.1 MB简体中文18-04-18
- 查看详情java语言程序设计进阶篇原书第10版 pdf完整版67.5 MB简体中文18-01-31
- 查看详情node.js开发指南(郭家宝) pdf完整版5.56 MB简体中文18-05-31
- 查看详情linux内核设计与实现原书第3版 pdf清晰电子版36.7 MB简体中文18-06-30
- 查看详情php与mysql程序设计第4版 带书签 pdf高清免费版59.9 MB简体中文18-01-29
人气软件
03s702钢筋混凝土化粪池图集12.3 MB
/简体中文16g101-3图集45.9 MB
/简体中文netty实战(带书签目录)12.9 MB
/简体中文10s406建筑排水塑料管道安装图集3.6 MB
/简体中文人月神话(32周年中文纪念版)30.3 MB
/简体中文中国铁路地图下载1.21 MB
/简体中文数据结构c++第3版(邓俊辉著)19.3 MB
/简体中文java语言程序设计进阶篇原书第10版67.5 MB
/简体中文python语言在abaqus中的应用35.1 MB
/简体中文企业应用架构模式-[英]福勒著35.9 MB
/简体中文
相关文章
查看所有评论>>网友评论共0条
精彩评论