0 0 0

白话大数据与机器学习.epub

尤怨
1月前 300
我用夸克网盘分享了「白话大数据与机器学习.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
白话大数据与机器学习 作者: 卫峥/尹会生/高扬 出版社: 机械工业出版社 出版年: 2016-6 页数: 329 定价: 69 装帧: 平装 ISBN: 9787111538479

内容简介

本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选: ·大数据产业解读一一剖析产业情况,人才供需、职业选择与相应“武器”库; ·步入大数据之门一一解读数据、信息、算法,以及与大数据应用的关系; ·大数据基石一一结合大量示例和漫画,趣味讲解大数据算法应掌握的数学知识,无障碍学习; ·大数据算法奥义——信息论、向量空间、回归、聚类、分类等最为核心的算法的释义与应用,举重若轻; ·大数据热门应用——关联分析、用户画像、推荐算法、文本挖掘、人工神经网络等最实用、最需要了解的应用的原理与实现; ·大数据主流框架一一介绍了主流的大数据框架(Hadoop、Spark和Cassandra); ·系统架构与调优一一从速度与稳定性方面给出调优的一般性“内功心法”; ·大数据价值与变现一一从运营指标、AB测试、大数据价值与变现场景多维度解读。

作者简介

本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选: ·大数据产业解读一一剖析产业情况,人才供需、职业选择与相应“武器”库; ·步入大数据之门一一解读数据、信息、算法,以及与大数据应用的关系; ·大数据基石一一结合大量示例和漫画,趣味讲解大数据算法应掌握的数学知识,无障碍学习; ·大数据算法奥义——信息论、向量空间、回归、聚类、分类等最为核心的算法的释义与应用,举重若轻; ·大数据热门应用——关联分析、用户画像、推荐算法、文本挖掘、人工神经网络等最实用、最需要了解的应用的原理与实现; ·大数据主流框架一一介绍了主流的大数据框架(Hadoop、Spark和Cassandra); ·系统架构与调优一一从速度与稳定性方面给出调优的一般性“内功心法”; ·大数据价值与变现一一从运营指标、AB测试、大数据价值与变现场景多维度解读。

网友热评

阳光普照: 相关知识挺多,看的纸质版,网易蜗牛里已经上了 超威拦猫: 面试时吹到机器学习算法终于可以稍微扯两句了

图书目录

前言 第1章 大数据产业1 1.1 大数据产业现状1 1.2 对大数据产业的理解2 1.3 大数据人才3 1.3.1 供需失衡3 1.3.2 人才方向3 1.3.3 环节和工具5 1.3.4 门槛障碍6 1.4 小结8 第2章 步入数据之门9 2.1 什么是数据9 2.2 什么是信息10 2.3 什么是算法12 2.4 统计、概率和数据挖掘13 2.5 什么是商业智能13 2.6 小结14 第3章 排列组合与古典概型15 3.1 排列组合的概念16 3.1.1 公平的决断——扔硬币16 3.1.2 非古典概型17 3.2 排列组合的应用示例18 3.2.1 双色球彩票18 3.2.2 购车摇号20 3.2.3 德州扑克21 3.3 小结25 第4章 统计与分布27 4.1 加和值、平均值和标准差27 4.1.1 加和值28 4.1.2 平均值29 4.1.3 标准差30 4.2 加权均值32 4.2.1 混合物定价32 4.2.2 决策权衡34 4.3 众数、中位数35 4.3.1 众数36 4.3.2 中位数37 4.4 欧氏距离37 4.5 曼哈顿距离39 4.6 同比和环比41 4.7 抽样43 4.8 高斯分布45 4.9 泊松分布49 4.10 伯努利分布52 4.11 小结54 第5章 指标55 5.1 什么是指标55 5.2 指标化运营58 5.2.1 指标的选择58 5.2.2 指标体系的构建62 5.3 小结63 第6章 信息论64 6.1 信息的定义64 6.2 信息量65 6.2.1 信息量的计算65 6.2.2 信息量的理解66 6.3 香农公式68 6.4 熵70 6.4.1 热力熵70 6.4.2 信息熵72 6.5 小结75 第7章 多维向量空间76 7.1 向量和维度76 7.1.1 信息冗余77 7.1.2 维度79 7.2 矩阵和矩阵计算80 7.3 数据立方体83 7.4 上卷和下钻85 7.5 小结86 第8章 回归87 8.1 线性回归87 8.2 拟合88 8.3 残差分析94 8.4 过拟合99 8.5 欠拟合100 8.6 曲线拟合转化为线性拟合101 8.7 小结104 第9章 聚类105 9.1 K-Means算法106 9.2 有趣模式109 9.3 孤立点110 9.4 层次聚类110 9.5 密度聚类113 9.6 聚类评估116 9.6.1 聚类趋势117 9.6.2 簇数确定119 9.6.3 测定聚类质量121 9.7 小结124 第10章 分类125 10.1 朴素贝叶斯126 10.1.1 天气的预测128 10.1.2 疾病的预测130 10.1.3 小结132 10.2 决策树归纳133 10.2.1 样本收集135 10.2.2 信息增益136 10.2.3 连续型变量137 10.3 随机森林140 10.4 隐马尔可夫模型141 10.4.1 维特比算法144 10.4.2 前向算法151 10.5 支持向量机SVM154 10.5.1 年龄和好坏154 10.5.2 “下刀”不容易157 10.5.3 距离有多远158 10.5.4 N维度空间中的距离159 10.5.5 超平面怎么画160 10.5.6 分不开怎么办160 10.5.7 示例163 10.5.8 小结164 10.6 遗传算法164 10.6.1 进化过程164 10.6.2 算法过程165 10.6.3 背包问题165 10.6.4 极大值问题173 10.7 小结181 第11章 关联分析183 11.1 频繁模式和Apriori算法184 11.1.1 频繁模式184 11.1.2 支持度和置信度185 11.1.3 经典的Apriori算法187 11.1.4 求出所有频繁模式190 11.2 关联分析与相关性分析192 11.3 稀有模式和负模式193 11.4 小结194 第12章 用户画像195 12.1 标签195 12.2 画像的方法196 12.2.1 结构化标签196 12.2.2 非结构化标签198 12.3 利用用户画像203 12.3.1 割裂型用户画像203 12.3.2 紧密型用户画像204 12.3.3 到底“像不像”204 12.4 小结205 第13章 推荐算法206 13.1 推荐思路206 13.1.1 贝叶斯分类206 13.1.2 利用搜索记录207 13.2 User-basedCF209 13.3 Item-basedCF211 13.4 优化问题215 13.5 小结217 第14章 文本挖掘218 14.1 文本挖掘的领域218 14.2 文本分类219 14.2.1 Rocchio算法220 14.2.2 朴素贝叶斯算法223 14.2.3 K-近邻算法225 14.2.4 支持向量机SVM算法226 14.3 小结227 第15章 人工神经网络228 15.1 人的神经网络228 15.1.1 神经网络结构229 15.1.2 结构模拟230 15.1.3 训练与工作231 15.2 FANN库简介233 15.3 常见的神经网络235 15.4 BP神经网络235 15.4.1 结构和原理236 15.4.2 训练过程237 15.4.3 过程解释240 15.4.4 示例240 15.5 玻尔兹曼机244 15.5.1 退火模型244 15.5.2 玻尔兹曼机245 15.6 卷积神经网络247 15.6.1 卷积248 15.6.2 图像识别249 15.7 深度学习255 15.8 小结256 第16章 大数据框架简介257 16.1 著名的大数据框架257 16.2 Hadoop框架258 16.2.1 MapReduce原理259 16.2.2 安装Hadoop261 16.2.3 经典的WordCount264 16.3 Spark框架269 16.3.1 安装Spark270 16.3.2 使用Scala计算WordCount271 16.4 分布式列存储框架272 16.5 PrestoDB——神奇的CLI273 16.5.1 Presto为什么那么快273 16.5.2 安装Presto274 16.6 小结277 第17章 系统架构和调优278 17.1 速度——资源的配置278 17.1.1 思路一:逻辑层面的优化279 17.1.2 思路二:容器层面的优化279 17.1.3 思路三:存储结构层面的优化280 17.1.4 思路四:环节层面的优化280 17.1.5 资源不足281 17.2 稳定——资源的可用282 17.2.1 借助云服务282 17.2.2 锁分散282 17.2.3 排队283 17.2.4 谨防“雪崩”283 17.3 小结285 第18章 数据解读与数据的价值286 18.1 运营指标286 18.1.1 互联网类型公司常用指标287 18.1.2 注意事项288 18.2 AB测试289 18.2.1 网页测试290 18.2.2 方案测试290 18.2.3 灰度发布292 18.2.4 注意事项293 18.3 数据可视化295 18.3.1 图表295 18.3.2 表格299 18.4 多维度——大数据的灵魂299 18.4.1 多大算大299 18.4.2 大数据网络300 18.4.3 去中心化才能活跃301 18.4.4 数据会过剩吗302 18.5 数据变现的场景303 18.5.1 数据价值的衡量的讨论303 18.5.2 场景1:征信数据307 18.5.3 场景2:宏观数据308 18.5.4 场景3:画像数据309 18.6 小结310 附录A VMwareWorkstation的安装311 附录B CentOS虚拟机的安装方法314 附录C Python语言简介318 附录D Scikit-learn库简介323 附录E FANNforPython安装324 附录F 群众眼中的大数据325 写作花絮327 参考文献329

白话大数据与机器学习.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 灿烂
  • 北城以北安静的夜
  • 你真让我很蛋疼
  • 你的男神我的仇人
  • 你可以滚蛋了
  • 芳春柳摇染花香
  • 时光不停的在转动
  • Morbid病态
  • 瑾晨
  • 心疼你伤很深
  • 我用你的心酿成酒
  • 我怀念的是那片星空
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!