找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 24|回复: 1

不懂就问,最近在学scrapy,有个问题请教下

[复制链接]

7

主题

13

回帖

55

积分

注册会员

积分
55
发表于 2016-11-8 12:23:11 | 显示全部楼层 |阅读模式
今天找代--理时g到了这个网站 proxylist@hidemyass@com,想把它抓下来,可是gdt看的时候,发现它列表中IP地址有很多干扰,怎么样去掉这些一干扰?
用gdt看的时候发现innterText这个属性显示的是处理后的正常的地址,但是xpath可以用这个不?
回复

使用道具 举报

24

主题

239

回帖

624

积分

高级会员

积分
624
发表于 2016-11-8 17:11:44 | 显示全部楼层

大风起 发表于 2016-11-8 17:11

https://www.v2ex.com/t/238821

谢谢大神,有思路了,我去试试
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-6-27 00:13 , Processed in 0.015584 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表