
上QQ阅读APP看书,第一时间看更新
4.1 概念介绍
说到正则表达式,大家可能比较陌生。但是,实际上我们每天都在使用正则表达式,浏览器每天用不?淘宝经常逛不?你在搜索框里输入几个文字,按下回车,就出来大量结果,你想想这是怎么办到的?这便是正则表达式,可以毫不夸张地讲,没有正则表达式,就没有搜索引擎。正则式案例的网页截图如图4-1所示。
图4-1 正则式案例
看看图中画框线的部分,为什么输入“欧佩克”文字,网址里面也会出现相应文字,是因为浏览器已经帮你生成了正则表达式,也就是方框所圈住的那一部分内容。当然,搜索引擎绝不只是正则表达式这么简单,但正则表达式无疑占据了最核心的部位。
正则表达式是一个特殊的字符序列,又称规则表达式(regular expression,在代码中常简写为regex、regexp或re),其本质上来说是一种小型的、高度专业化的编程语言,通常被用来检索、替换那些符合某个模式(规则)的文本。在Python中它内嵌在re模块实现,re模块使Python语言拥有全部的正则表达式功能,能帮你方便地检查一个字符串是否与某种模式匹配。