如何用正则表达式匹配多行文本
有时候抓取到的目标元素因为排版不正规会出现多行文本的情况,由于多行文本在打印log时会被强制降级为string,所以单从log是看不出来的,有时候还得去查原页面的dom才能发现多行文本。为了避免这种情况,可以使用标记始终将多行文本当作单行文本来匹配。
匹配目标
1 2 3 |
Download 百度云 链接: https://pan.baidu.com/s/1mi1XKgg 密码: i1ki |
正则表达式
1 |
/.*pan\.baidu\.com\/s\/(\w+).*密码\W*(\S+)/s |
其中使用了s标记,把多行文本作为单行文本看待,这样就可以使用单行条件来匹配需要的内容
There are no comments yet