自己有一个小爬虫网站 ( http://learnbyreading.herokuapp.com/)
但感觉 Amazon 的数据太难爬了,容易被封
所以,有没有可能把爬虫的一部分写到客户端,通过用户的浏览器去爬,然后返回一部分数据给我,这样我就不用去买 IP 了。。。。。
1
chwhsen 2018 年 12 月 18 日
木马爬虫?
|
2
chengxiao 2018 年 12 月 18 日
兄弟 你这个跟肉鸡有什么区别?
哪天 high 了 一波 DDOS 带走~ |
3
kruskal 2018 年 12 月 18 日
醒醒,把用户当肉鸡是违法行为
|
4
freed 2018 年 12 月 18 日
你能做到这个肯定有比较大的控制权限了,还靠他来爬东西?
啥时候开始了告诉一声啊.我看看有没有达到量刑标准,要判几年 |
6
orangeade 2018 年 12 月 18 日
不如先爬免费的 IP 代理池
|
7
gamexg 2018 年 12 月 18 日
感觉比价插件是一个很好的分布式爬虫。
用户打开商品页面显示价格历史时自动将商品当前价格上传。 |
8
t6attack 2018 年 12 月 18 日
浏览器的 跨域限制 就是针对你的。
|
9
Trim21 2018 年 12 月 18 日
你想问的是无头浏览器吗, 还是真的像楼上说的那样想用某些正常用户的浏览器爬数据
|
10
westoy 2018 年 12 月 18 日
不可能, 但是可以让用户通过类似 yahoo YQL 的方法给你提供数据, 问题是验证数据真实性的成本可能比多搞一个 IP 池高......
|
12
akafeng 2018 年 12 月 19 日 via iPhone
楼主大概需要什么量级的代理池呢?
|
13
agdhole 2018 年 12 月 19 日
京价保插件不就是这个原理吗
|
14
onedayoneapple 2018 年 12 月 19 日 via iPhone
@orangeade 这个怎么爬
|
16
wly19960911 2018 年 12 月 19 日 via Android
js 的话浏览器跨域怎么解决
|
17
woshipanghu 2018 年 12 月 19 日
electron nightmare 你去看看 可能是你要的
没什么浏览器跨域的问题,直接往页面里面注入你的 js 都行 |
18
zhchyu999 2018 年 12 月 19 日
有 refer 的
|
20
boweixiaobang 2019 年 8 月 8 日
小帮软件机器人,是做客户端软件数据的自动采集和写入的。
CS 的采集和写入小帮都有优势。 |