清华大学出版！521页Python爬虫入门级文档，一文get，建议收藏！

2024-04-09 20:00:54 阅读数 1892

都说爬虫爬得好，牢饭吃到饱！

虽然这样的调侃很多，但是依然有很多人对Python爬虫感兴趣。一入爬虫深似海，越往后面就“陷得越深，掉到坑爬不出来的那种"。

u=4144322113,169720321&fm=30&app=106&f=PNG&access=215967316.png

为什么还会有那么多想学Python爬虫，一部分原因是Python爬虫很酷炫，可以爬取一些想要的东西。还有另外一部分原因是Python爬虫，可以轻松帮忙收集一些数据，辅助工作。而且还可以兼职当副业。所以很多人对Python爬虫的兴趣永不停止。

但是很多初学者对Python爬虫十分感兴趣，学起来仍是一头雾水，不知从何下手，理论学得扎扎实实，但是实操起来可以一戳就破。

所以在这里我想推荐一份由清华大学出版的521页《Python网络爬虫实战》第2版，从实战出发，根据不同的需求选取不同的爬虫，有针对性地讲解了几种Python网络爬虫。

共10章，内容丰富，实例典型，实用性强。适合Python网络爬虫初学者、Python数据分析与挖掘技术初学者，以及高等院校和培训学校相关专业的师生阅读。

内容预览：

第1章　Python环境配置

1.1 Python简介
1.2 Python 3.6.4开发环境配置
1.3　本章小结

u=3117671450,169720323&fm=30&app=106&f=PNG&access=215967316.png

第2章　Python基础

2.1 Python变量类型
2.2 Python语句
2.3　函数和类
......

u=2916426606,169720329&fm=30&app=106&f=PNG&access=215967316.png

第3章　简单的Python脚本

3.1　九九乘法表
3.2　斐波那契数列
3.3　概率计算

u=3819875087,169720329&fm=30&app=106&f=PNG&access=215967316.png

第4章　Python爬虫常用模块

4.1　网络爬虫技术核心
4.2 Python 3标准库之urllib.request模块
4.3 Python 3标准库之logging模块

u=410139124,169720325&fm=30&app=106&f=PNG&access=215967316.png

第5章　Scrapy爬虫框架

5.1　安装Scrapy
5.2 Scrapy选择器XPath和CSS
5.3 Scrapy爬虫实战一：今日影视

第6章　Beautiful Soup爬虫

6.1　安装Beautiful Soup环境
6.2 Beautiful Soup解析器
6.3 bs4爬虫实战一：获取百度贴吧内容

第7章　Mechanize模拟浏览器

7.1　安装Mechanize模块
7.2 Mechanize测试
7.3 Mechanize实战一：获取Modem信息

第8章　Selenium模拟浏览器

8.1　安装Selenium模块
8.2　浏览器选择
8.3 Selenium&PhantomJS抓取数据

第9章　Pyspider爬虫框架

9.1　安装Pyspider
9.2 Pyspider实战一：Youku影视排行
9.3 Pyspider实战二：电影下载

第10章　爬虫与反爬虫

10.1　防止爬虫IP被禁
10.2　在爬虫中使用Cookies

如果对Python爬虫有兴趣，对资料有兴趣的可以私信，可以分享出来。

内容预览：

第1章 Python环境配置

第2章 Python基础

第3章 简单的Python脚本

第4章 Python爬虫常用模块

第5章 Scrapy爬虫框架

第6章 Beautiful Soup爬虫

第7章 Mechanize模拟浏览器

第8章 Selenium模拟浏览器

第9章 Pyspider爬虫框架

第10章 爬虫与反爬虫