Python爬虫开发:从入门到实战(微课版)
上QQ阅读APP看书,第一时间看更新

■ 在爬虫的开发中,需要把有用的信息从一大段文本中提取出来。正则表达式是提取信息的方法之一。正则表达式虽然不是最简单的也不是最高效的数据提取方法,但它是最直接的。而且在某些情况下,只有使用正则表达式才能达到目的。学好正则表达式,是开发爬虫的第一步。

通过这一章的学习,你将会掌握如下知识。

(1)正则表达式的基本符号。

(2)如何在Python中使用正则表达式。

(3)正则表达式的提取技巧。

(4)Python读写文本文件和CSV文件。