都说爬虫爬得好,牢饭吃到饱!
虽然这样的调侃很多,但是依然有很多人对Python爬虫感兴趣。一入爬虫深似海,越往后面就“陷得越深,掉到坑爬不出来的那种"。
为什么还会有那么多想学Python爬虫,一部分原因是Python爬虫很酷炫,可以爬取一些想要的东西。还有另外一部分原因是Python爬虫,可以轻松帮忙收集一些数据,辅助工作。而且还可以兼职当副业。所以很多人对Python爬虫的兴趣永不停止。
但是很多初学者对Python爬虫十分感兴趣,学起来仍是一头雾水,不知从何下手,理论学得扎扎实实,但是实操起来可以一戳就破。
所以在这里我想推荐一份由清华大学出版的521页《Python网络爬虫实战》第2版,从实战出发,根据不同的需求选取不同的爬虫,有针对性地讲解了几种Python网络爬虫。
共10章,内容丰富,实例典型,实用性强。适合Python网络爬虫初学者、Python数据分析与挖掘技术初学者,以及高等院校和培训学校相关专业的师生阅读。
1.1 Python简介
1.2 Python 3.6.4开发环境配置
1.3 本章小结
2.1 Python变量类型
2.2 Python语句
2.3 函数和类
......
3.1 九九乘法表
3.2 斐波那契数列
3.3 概率计算
4.1 网络爬虫技术核心
4.2 Python 3标准库之urllib.request模块
4.3 Python 3标准库之logging模块
5.1 安装Scrapy
5.2 Scrapy选择器XPath和CSS
5.3 Scrapy爬虫实战一:今日影视
6.1 安装Beautiful Soup环境
6.2 Beautiful Soup解析器
6.3 bs4爬虫实战一:获取百度贴吧内容
7.1 安装Mechanize模块
7.2 Mechanize测试
7.3 Mechanize实战一:获取Modem信息
8.1 安装Selenium模块
8.2 浏览器选择
8.3 Selenium&PhantomJS抓取数据
9.1 安装Pyspider
9.2 Pyspider实战一:Youku影视排行
9.3 Pyspider实战二:电影下载
10.1 防止爬虫IP被禁
10.2 在爬虫中使用Cookies
如果对Python爬虫有兴趣,对资料有兴趣的可以私信,可以分享出来。