×

正在处理。。。

即刻使用手机阅读

编程语言与程序设计 实战Python网络爬虫

作者:黄永祥 字数:23.1万字 出版社:清华大学出版社

价格:5940阅饼

免费试读 购买
扫一扫 扫一扫

本书从原理到实践,循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,包括网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网站做全面分析;数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识;数据清洗主要介绍字符串操作、正则和BeautifulSoup的使用;数据入库讲述了MySQL和MongoDB的操作,通过ORM框架SQLAlchemy实现数据持久化,进行企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件的开发、12306抢票程序和微博爬取等。框架篇主要讲述流行的爬虫框架Scrapy,并以Scrapy与Selenium、Splash、Redis结合的项目案例,让读者深层次了解Scrapy的使用。

获取掌阅iReader

京ICP备11008516号(署)网出证(京)字第143号京ICP证090653号京公网安备11010502030452

2015 All Rights Reserved 掌阅科技股份有限公司 版权所有

不良信息举报:jubao@zhangyue.com 举报电话:010-59845699