0 0 0

深度实践Spark机器学习.epub

把音书
1月前 310
我用夸克网盘分享了「深度实践Spark机器学习.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
深度实践spark机器学习 作者: 吴茂贵/郁明敏/朱凤元/张粤磊 出版社: 机械工业出版社 出版年: 2018-2 页数: 233 定价: 69.00元 装帧: 平装 ISBN: 9787111589952

内容简介

本书系统讲解了Spark机器学习的技术、原理、组建、算法,以及构建Spark机器学习系统的方法、流程、标准和规范。此外,还介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络。

作者简介

吴茂贵 资深BI和大数据专家,在BI、数据挖掘与分析、数据仓库、机器学习等领域有超过20年的工作经验,在Spark机器学习、TensorFlow深度学习领域有大量的实践经验。 郁明敏 对大数据、机器学习有一定的研究,擅长Python、Hadoop、Spark等技术,曾或得“江苏省TI杯大学生电子竞技大赛”二等奖和全国大学生数学建模大赛二等奖。

网友热评

Green: 价格越来越高,价值越来越低,通篇介绍概念…… 码小辫: 这本书还算不错,介绍Spark知识点比较全面,如果是小白用户需要多读几遍,入门或者当成工具书很不错,我收藏了本书的电子版,大家可以下载到手机看,多读几遍,会有感悟的,电子版给你http://www.xz577.com/e/518.html 功夫老五: 内容还可以,把spark用于机器学习的流程都基本讲到了,就是很垃圾的一点为啥不提供源代码下载,提供的云平台也登陆不了

图书目录

前言 第1章 了解机器学习1 1.1 机器学习的定义1 1.2 大数据与机器学习2 1.3 机器学习、人工智能及深度学习2 1.4 机器学习的基本任务3 1.5 如何选择合适算法4 1.6 Spark在机器学习方面的优势5 1.7 小结5 第2章 构建Spark机器学习系统6 2.1 机器学习系统架构6 2.2 启动集群7 2.3 加载数据9 2.4 探索数据10 2.4.1 数据统计信息10 2.4.2 数据质量分析11 2.4.3 数据特征分析12 2.4.4 数据的可视化17 2.5 数据预处理19 2.5.1 数据清理20 2.5.2 数据变换21 2.5.3 数据集成22 2.5.4 数据归约23 2.6 构建模型25 2.7 模型评估26 2.8 组装30 2.9 模型选择或调优30 2.9.1 交叉验证31 2.9.2 训练–验证切分32 2.10 保存模型32 2.11 小结33 第3章 MLPipeline原理与实战34 3.1 Pipeline简介34 3.2 DataFrame35 3.3 Pipeline组件36 3.4 Pipeline原理37 3.5 Pipeline实例38 3.5.1 使用Estimator、Transformer和Param的实例38 3.5.2 ML使用Pipeline的实例40 3.6 小结41 第4章 特征提取、转换和选择42 4.1 特征提取42 4.1.1 词频—逆向文件 频率(TF-IDF)42 4.1.2 Word2Vec43 4.1.3 计数向量器44 4.2 特征转换45 4.2.1 分词器45 4.2.2 移除停用词46 4.2.3 n-gram47 4.2.4 二值化48 4.2.5 主成分分析48 4.2.6 多项式展开50 4.2.7 离散余弦变换50 4.2.8 字符串—索引变换51 4.2.9 索引—字符串变换53 4.2.10 独热编码54 4.2.11 向量—索引变换57 4.2.12 交互式58 4.2.13 正则化59 4.2.14 规范化60 4.2.15 最大值—最小值缩放60 4.2.16 最大值—绝对值缩放61 4.2.17 离散化重组62 4.2.18 元素乘积63 4.2.19 SQL转换器64 4.2.20 向量汇编65 4.2.21 分位数离散化66 4.3 特征选择67 4.3.1 向量机67 4.3.2 R公式69 4.3.3 卡方特征选择70 4.4 小结71 第5章 模型选择和优化72 5.1 模型选择72 5.2 交叉验证73 5.3 训练验证拆分法75 5.4 自定义模型选择76 5.5 小结78 第6章 SparkMLlib基础79 6.1 SparkMLlib简介80 6.2 SparkMLlib架构81 6.3 数据类型82 6.4 基础统计84 6.4.1 摘要统计84 6.4.2 相关性84 6.4.3 假设检验85 6.4.4 随机数据生成85 6.5 RDD、Dataframe和Dataset86 6.5.1 RDD86 6.5.2 DatasetDataFrame87 6.5.3 相互转换88 6.6 小结89 第7章 构建SparkML推荐模型90 7.1 推荐模型简介91 7.2 数据加载92 7.3 数据探索94 7.4 训练模型94 7.5 组装95 7.6 评估模型96 7.7 模型优化96 7.8 小结98 第8章 构建SparkML分类模型99 8.1 分类模型简介99 8.1.1 线性模型100 8.1.2 决策树模型101 8.1.3 朴素贝叶斯模型102 8.2 数据加载102 8.3 数据探索103 8.4 数据预处理104 8.5 组装109 8.6 模型优化110 8.7 小结113 第9章 构建SparkML回归模型114 9.1 回归模型简介115 9.2 数据加载115 9.3 探索特征分布117 9.4 数据预处理120 9.4.1 特征选择121 9.4.2 特征转换121 9.5 组装122 9.6 模型优化124 9.7 小结126 第10章 构建SparkML聚类模型127 10.1 K-means模型简介128 10.2 数据加载129 10.3 探索特征的相关性129 10.4 数据预处理131 10.5 组装132 10.6 模型优化134 10.7 小结136 第11章 PySpark决策树模型137 11.1 PySpark简介138 11.2 决策树简介139 11.3 数据加载140 11.3.1 原数据集初探140 11.3.2 PySpark的启动142 11.3.3 基本函数142 11.4 数据探索143 11.5 数据预处理143 11.6 创建决策树模型145 11.7 训练模型进行预测146 11.8 模型优化149 11.8.1 特征值的优化149 11.8.2 交叉验证和网格参数152 11.9 脚本方式运行154 11.9.1 在脚本中添加配置信息154 11.9.2 运行脚本程序154 11.10 小结154 第12章 SparkR朴素贝叶斯模型155 12.1 SparkR简介156 12.2 获取数据157 12.2.1 SparkDataFrame数据结构 说明157 12.2.2 创建SparkDataFrame157 12.2.3 SparkDataFrame的常用操作160 12.3 朴素贝叶斯分类器162 12.3.1 数据探查162 12.3.2 对原始数据集进行转换163 12.3.3 查看不同船舱的生还率差异163 12.3.4 转换成SparkDataFrame格式的数据165 12.3.5 模型概要165 12.3.6 预测165 12.3.7 评估模型166 12.4 小结167 第13章 使用SparkStreaming构建在线学习模型168 13.1 SparkStreaming简介168 13.1.1 SparkStreaming常用术语169 13.1.2 SparkStreaming处理流程169 13.2 Dstream操作

深度实践Spark机器学习.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 醉声梦死
  • 玻璃球
  • Faith信仰
  • 无人缘
  • 你会发光呦
  • 应场落梅风
  • 谈何感动
  • 换个角度
  • 熬过浮华沧桑嫁我好吗
  • 逢正抽心
  • 心凉梦以醒
  • 打碎面具
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!