我司有好几个proxy可以用,但是都不太稳定。
我想的就是假设有n个Proxy,在爬取失败的时候首先自己重试3次。如果重试失败就切换到下一个proxy。如果成功就继续使用当前的proxy,如果失败就一直切换代理直到没有可用的代理。如果最终还是失败了,就以某种方式记录一下,下次重新爬一遍。
不知道我的想法在scrapy之中如何实现?
如果有例子代码就更好了~
最终目的就是保证目标url能被正确的爬出结果。如果有其他更好的解决方案也麻烦说一下~
多谢!
我想的就是假设有n个Proxy,在爬取失败的时候首先自己重试3次。如果重试失败就切换到下一个proxy。如果成功就继续使用当前的proxy,如果失败就一直切换代理直到没有可用的代理。如果最终还是失败了,就以某种方式记录一下,下次重新爬一遍。
不知道我的想法在scrapy之中如何实现?
如果有例子代码就更好了~
最终目的就是保证目标url能被正确的爬出结果。如果有其他更好的解决方案也麻烦说一下~
多谢!