文件名称:用Python写网络爬虫2
介绍说明--下载内容均来自于网络,请自行研究使用
作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取(As an excellent guide for using Python to crawl network data, it explains how to crawl data from static pages and how to use caching to manage server loads. In addition, the book also introduces how to use AJAX URL and Firebug extensions to crawl data, as well as more truths about crawling techniques, such as using browsers to render, managing cookie, and submitting forms to extract data from complex sites protected by a validation code. This book uses Scrapy to create a high-level web crawler and crawls some real Web sites.)
(系统自动生成,下载前可以参看下载内容)
下载文件列表
文件名 | 大小 | 更新时间 |
---|---|---|
用Python写网络爬虫2.pdf | 10348169 | 2018-03-13 |