0 0 0

Spark机器学习进阶实战.epub

清嫩少女音
1月前 350
我用夸克网盘分享了「Spark机器学习进阶实战.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
Spark机器学习进阶实战/大数据技术丛书 作者: 马海平,于俊,吕昕,向海 出版社: 机械工业出版社 出版年: 2018-9-1 页数: 210 定价: 59 装帧: 平装 丛书: 大数据技术丛书 ISBN: 9787111608103

内容简介

科大讯飞大数据专家团队撰写 不囿于Spark机器学习库 突出工程化思维与实战 本书分为三大部分: 基础篇(1-2章)对Spark机器学习机型概述、并通过Spark机器学习开始进行数据分析 算法篇(3-8章)针对聚类、分类、回归、协同过滤、关联规则、降维等算法进行详细讲解,并进行案例支持 综合案例篇(9-12章)重点通过异常检测、用户画像、广告点击率预估、智慧交通大数据4个综合场景,详细讲解基于Spark机器学习的综合应用

作者简介

马海平 科大讯飞大数据研究院研究主管,中国科学与技术大学计算机技术博士,专注数据挖掘和人工智能算法的研究,及其在计算广告和个性化教育等方向的落地应用。 于俊 科大讯飞大数据专家,专注大数据和人工智能应用方案设计、基于Spark的大数据分析和价值挖掘,在大数据算法工程化实现方面具有丰富经验。 吕昕 科大讯飞大数据专家,专注大数据和人工智能技术在消费者业务中的应用、基于Spark的大数据分析和算法建模,在用户画像、内容推荐和精准营销领域有丰富的实践。 向海 邂智科技算法负责人,前科大讯飞大数据专家。专注Spark机器学习在智能客服中的应用,在NLP与对话机器人应用方面有丰富经验。

网友热评

ijmdlsydnda: Spark进阶-大数据离线与实时项目实战 网盘地址:https://pan.baidu.com/s/1oF8vJLFAwKHpwyzk3JWFQw 提取码:8r3n

图书目录

前 言 第一篇 基础篇 第1章 机器学习概述2 1.1 机器学习概述2 1.1.1 理解大数据2 1.1.2 机器学习发展过程4 1.1.3 大数据生态环境5 1.2 机器学习算法6 1.2.1 传统机器学习6 1.2.2 深度学习8 1.2.3 其他机器学习8 1.3 机器学习分类9 1.3.1 监督学习9 1.3.2 无监督学习10 1.3.3 半监督学习10 1.3.4 强化学习10 1.4 机器学习综合应用11 1.4.1 异常检测12 1.4.2 用户画像12 1.4.3 广告点击率预估12 1.4.4 企业征信大数据应用12 1.4.5 智慧交通大数据应用13 1.5 本章小结13 第2章 数据分析流程和方法14 2.1 数据分析概述14 2.2 数据分析流程15 2.2.1 业务调研16 2.2.2 明确目标16 2.2.3 数据准备16 2.2.4 特征处理17 2.2.5 模型训练与评估21 2.2.6 输出结论23 2.3 数据分析的基本方法24 2.3.1 汇总统计24 2.3.2 相关性分析25 2.3.3 分层抽样26 2.3.4 假设检验26 2.4 简单的数据分析实践27 2.4.1 环境准备27 2.4.2 准备数据28 2.4.3 数据分析29 2.5 本章小结30 第二篇 算法篇 第3章 构建分类模型32 3.1 分类模型概述32 3.2 分类模型算法34 3.2.1 逻辑回归34 3.2.2 朴素贝叶斯模型36 3.2.3 SVM模型37 3.2.4 决策树模型39 3.2.5 K-近邻40 3.3 分类效果评估40 3.3.1 正确率41 3.3.2 准确率、召回率和F1值41 3.3.3 ROC和AUC42 3.4 App数据的分类实现44 3.4.1 选择分类器44 3.4.2 准备数据45 3.4.3 训练模型46 3.4.4 模型性能评估48 3.4.5 模型参数调优49 3.5 其他分类模型50 3.5.1 随机森林50 3.5.2 梯度提升树51 3.5.3 因式分解机模型51 3.6 本章小结52 第4章 构建聚类模型53 4.1 聚类概述53 4.2 聚类模型54 4.2.1 KMeans聚类54 4.2.2 DBSCAN聚类55 4.2.3 主题聚类56 4.3 聚类效果评价58 4.3.1 集中平方误差和58 4.3.2 Purity评价法59 4.4 使用KMeans对鸢尾花卉数据集聚类59 4.4.1 准备数据59 4.4.2 特征处理60 4.4.3 聚类分析60 4.4.4 模型性能评估62 4.5 使用DBSCAN对GPS数据进行聚类62 4.5.1 准备数据63 4.5.2 特征处理64 4.5.3 聚类分析64 4.5.4 模型参数调优65 4.6 其他模型66 4.6.1 层次聚类66 4.6.2 基于图的聚类67 4.6.3 混合聚类模型67 4.7 本章小结68 第5章 构建回归模型69 5.1 常用回归模型69 5.1.1 线性回归模型70 5.1.2 回归树模型70 5.1.3 其他回归模型71 5.2 评估指标73 5.3 回归模型优化74 5.3.1 特征选择74 5.3.2 特征变换74 5.4 构建UCI裙子销售数据回归模型75 5.4.1 准备数据75 5.4.2 训练模型78 5.4.3 评估效果79 5.4.4 模型优化79 5.5 其他回归模型案例80 5.5.1 GDP影响因素分析81 5.5.2 大气污染分析81 5.5.3 大数据比赛中的回归问题81 5.6 本章小结82 第6章 构建关联规则模型83 6.1 关联规则概述83 6.2 常用关联规则算法84 6.2.1 Apriori算法84 6.2.2 FP-Growth算法85 6.3 效果评估和优化86 6.3.1 效果评估86 6.3.2 效果优化87 6.4 使用FP-Growth对豆瓣评分数据进行挖掘88 6.4.1 准备数据89 6.4.2 训练模型89 6.4.3 观察规则91 6.4.4 参数调优91 6.4.5 使用算法92 6.5 其他应用场景94 6.6 本章小结96 第7章 协同过滤97 7.1 协同过滤概述97 7.2 常用的协同过滤算法98 7.2.1 基于用户的协同过滤99 7.2.2 基于物品的协同过滤100 7.2.3 矩阵分解技术101 7.2.4 推荐算法的选择102 7.3 评估标准103 7.3.1 准确率103 7.3.2 覆盖率103 7.3.3 多样性104 7.3.4 其他指标104 7.4 使用电影评分数据进行协同过滤实践104 7.4.1 准备数据105 7.4.2 训练模型106 7.4.3 测试模型109 7.4.4 使用ALS结果111 7.5 本章小结112 第8章 数据降维113 8.1 降维概述113 8.2 常用降维算法114 8.2.1 主成分分析114 8.2.2 奇异值分解116 8.2.3 广义降维117 8.2.4 文本降维118 8.3 降维评估标准121 8.4 使用PCA对Digits数据集进行降维122 8.4.1 准备数据122 8.4.2 训练模型123 8.4.3 分析降维结果124 8.5 其他降维方法124 8.5.1 线性判别分析124 8.5.2 局部线性嵌入125 8.5.3 拉普拉斯特征映射125 8.6 本章小结126 第三篇 综合应用篇 第9章 异常检测128 9.1 异常概述128 9.1.1 异常的产生129 9.1.2 异常检测的分类129 9.2 异常检测方法130 9.2.1 基于模型的方法130 9.2.2 基于邻近度的方法131 9.2.3 基于密度的方法132 9.2.4 基于聚类的方法133 9.3 异常检测系统133 9.3.1 异常检测过程133 9.

Spark机器学习进阶实战.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 梦里梦到她
  • 别让小三毁了沵们旳爱情
  • 名牌香烟
  • 软妹心
  • 沙漠一只雕
  • 专属她
  • 嘎蒙
  • 挂念的是你
  • 我黑因为我是太阳化身
  • 愤日青年
  • 柠檬你个思密达
  • 北海森屿
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!