查看: 106|回复: 3

有用神箭手的吗,问个正则问题?

[复制链接]

94

主题

2420

回帖

5286

积分

论坛元老

积分
5286
发表于 2018-1-24 11:51:58 | 显示全部楼层 |阅读模式
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页

这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导


回复

使用道具 举报

94

主题

2420

回帖

5286

积分

论坛元老

积分
5286
 楼主| 发表于 2018-1-24 12:08:37 | 显示全部楼层
来个大佬~~~

回复

使用道具 举报

10

主题

394

回帖

872

积分

高级会员

积分
872
发表于 2018-1-24 12:17:50 | 显示全部楼层
本帖最后由 Carseason 于 2018-1-24 12:19 编辑

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
回复

使用道具 举报

94

主题

2420

回帖

5286

积分

论坛元老

积分
5286
 楼主| 发表于 2018-1-24 12:48:53 | 显示全部楼层

Carseason 发表于 2018-1-24 12:17

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试

多谢!


按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

在本版发帖
关注公众号
返回顶部