Python网络爬虫从入门到精通
上QQ阅读APP看书,第一时间看更新

第7章 正则表达式

获取了Web资源(HTML代码)以后,接下来则需要在资源中提取重要的信息。对于Python爬虫来说,提取资源(HTML代码)中信息的方式多种多样,在不借助第三方模块的情况下,正则表达式是一个非常强大的工具,本章将介绍正则表达式的基础与使用re模块实现正则表达式的操作。