获取了Web资源(HTML代码)以后,接下来则需要在资源中提取重要的信息。对于Python爬虫来说,提取资源(HTML代码)中信息的方式多种多样,在不借助第三方模块的情况下,正则表达式是一个非常强大的工具,本章将介绍正则表达式的基础与使用re模块实现正则表达式的操作。