0 0 0

数据科学实战之网络爬取:Python实践和示例.epub

我女神她会发光
1月前 320
我用夸克网盘分享了「数据科学实战之网络爬取:Python实践和示例.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
数据科学实战之网络爬取 作者: 希普·万登·布鲁克/巴特·巴森斯 出版社: 机械工业出版社 副标题: python实践和示例 出版年: 2018-12 页数: 220 定价: 69 丛书: 数据科学与工程技术丛书 ISBN: 9787111614043

内容简介

希普·万登·布鲁克(Seppe vanden Broucke),巴特·巴森斯(Bart Baesens) 著:Seppe vanden Broucke是比利时鲁汶大学经济与商务学院数据科学方面的助理教授。他的研究兴趣包括商务数据挖掘和分析、机器学习、流程管理和流程挖掘,相关论文发表在知名国际期刊和顶级会议上。 Seppe从事包括高级分析、大数据和信息管理课程方面的教学工作,也经常提供工业和商业用户的培训。除了工作,Seppe喜欢旅行、阅读(从Murakami到Bukowski到Asimov)、听音乐(从Booka Shade到Miles Davis到Claude Debussy)、看电影和连续剧(由于没时间现在看得少多了)、玩游戏和关注新闻事件。 Bart Baesens是比利时鲁汶大学大数据和数据分析方面的教授,也是英国南安普顿大学的讲师。他对大数据及分析、信用风险建模、欺诈检测和营销分析进行了广泛的研究。Bart撰写了200多篇学术论文和若干本书。除了与家人共度时光外,他还是一名布鲁日足球俱乐部的铁杆球迷。Bart是美食家和业余厨师,他喜欢在他的酒窖里或者在花园里俯瞰红色英式电话亭时喝一杯好酒(他最喜欢的是白维欧尼或红赤霞珠)。Bart热爱旅行,对第一次世界大战着迷,并阅读了很多关于这个主题的书籍。

作者简介

希普·万登·布鲁克(Seppe vanden Broucke),巴特·巴森斯(Bart Baesens) 著:Seppe vanden Broucke是比利时鲁汶大学经济与商务学院数据科学方面的助理教授。他的研究兴趣包括商务数据挖掘和分析、机器学习、流程管理和流程挖掘,相关论文发表在知名国际期刊和顶级会议上。 Seppe从事包括高级分析、大数据和信息管理课程方面的教学工作,也经常提供工业和商业用户的培训。除了工作,Seppe喜欢旅行、阅读(从Murakami到Bukowski到Asimov)、听音乐(从Booka Shade到Miles Davis到Claude Debussy)、看电影和连续剧(由于没时间现在看得少多了)、玩游戏和关注新闻事件。 Bart Baesens是比利时鲁汶大学大数据和数据分析方面的教授,也是英国南安普顿大学的讲师。他对大数据及分析、信用风险建模、欺诈检测和营销分析进行了广泛的研究。Bart撰写了200多篇学术论文和若干本书。除了与家人共度时光外,他还是一名布鲁日足球俱乐部的铁杆球迷。Bart是美食家和业余厨师,他喜欢在他的酒窖里或者在花园里俯瞰红色英式电话亭时喝一杯好酒(他最喜欢的是白维欧尼或红赤霞珠)。Bart热爱旅行,对第一次世界大战着迷,并阅读了很多关于这个主题的书籍。

图书目录

译者序 作者简介 技术审校者简介 前言 第一部分网络爬取基础 第1章简介2 1.1什么是网络爬取2 1.1.1网络爬取为什么用于数据科学2 1.1.2谁在使用网络爬取4 1.2准备工作6 1.2.1设置6 1.2.2Python快速入门7 第2章网络传输协议HTTP18 2.1网络的魔力18 2.2超文本传输协议20 2.3Python中的HTTP—Requests库25 2.4带参数的URL查询字符串28 第3章HTML和CSS36 3.1超文本标记语言HTML36 3.2将浏览器用作开发工具38 3.3层叠样式表CSS42 3.4BeautifulSoup库45 3.5有关BeautifulSoup的更多内容53 第二部分高级网络爬取 第4章深入挖掘HTTP60 4.1使用表单和POST请求60 4.2其他HTTP请求方法71 4.3关于头的更多信息73 4.4使用Cookie79 4.5requests库的session对象87 4.6二进制、JSON和其他形式的内容89 第5章处理JavaScript93 5.1什么是JavaScript93 5.2爬取JavaScript94 5.3使用Selenium爬取网页98 5.4Selenium的更多信息109 第6章从网络爬取到网络爬虫115 6.1什么是网络爬虫115 6.2使用Python实现网络爬虫117 6.3数据库存储120 第三部分相关管理问题及最佳实践 第7章网络爬取涉及的管理和法律问题130 7.1数据科学过程130 7.2网络爬取适合用于哪里133 7.3法律问题134 第8章结语139 8.1其他工具139 8.1.1其他Python库139 8.1.2Scrapy库140 8.1.3缓存140 8.1.4代理服务器141 8.1.5基于其他编程语言的爬取141 8.1.6命令行工具142 8.1.7图形化的爬取工具142 8.2最佳实践和技巧143 第9章示例147 9.1爬取HackerNews网页148 9.2使用HackerNewsAPI150 9.3爬取引用信息150 9.4爬取书籍信息154 9.5爬取GitHub上项目被收藏的次数156 9.6爬取抵押贷款利率160 9.7爬取和可视化IMDB评级165 9.8爬取IATA航空公司信息166 9.9爬取和分析网络论坛的互动171 9.10收集和聚类时尚数据集177 9.11Amazon评论的情感分析180 9.12爬取和分析维基百科关联图188 9.13爬取和可视化董事会成员图194 9.14使用深度学习破解验证码图片197

数据科学实战之网络爬取:Python实践和示例.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 没有梦想、何必远方
  • 北荒玄武
  • 爱一直存在
  • 自由自私的灵魂
  • 夜的诗篇
  • 因为我爱你你才闪耀
  • 浪爷
  • 相思故
  • 写信人叫从前
  • 悲欢几何
  • 星月满屋
  • 失恋影响学习
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!