浅谈Python采集网页时正则表达式匹配换行符的问题

程序员文章站 2023-09-07 15:35:14

如下所示： p1 = r'(?<=

)(.*?)(?=

如下所示：

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错，采集不到数据，正则中 . 是不能匹配换行符，改成如下：
p1 = r'(?<=<div class="ds_cr">)([\s\s]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则，你现在可以不理解啥意思

[\s\s]

匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

上一篇： python爬虫之urllib,伪装,超时设置,异常处理的方法

下一篇：中暑最基本的饮食建议中暑应该这样预防

浅谈Python采集网页时正则表达式匹配换行符的问题

python正则表达式中的括号匹配问题

Python 匹配任意字符（包括换行符）的正则表达式写法

浅谈Python采集网页时正则表达式匹配换行符的问题

浅谈python下含中文字符串正则表达式的编码问题

python正则表达式中的括号匹配问题

Python 匹配任意字符（包括换行符）的正则表达式写法

浅谈Python采集网页时正则表达式匹配换行符的问题

Python 匹配任意字符（包括换行符）的正则表达式写法

Python 匹配任意字符（包括换行符）的正则表达式写法

python正则表达式中的括号匹配问题