问个问题，要把淘宝支付宝的登陆完全用 requests urllib 写出来，需要多强的前端和爬虫水平

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 2964 天前的主题，其中的信息可能已经有所发展或是发生改变。

我是从 java web 转到爬虫和数据的，以前，也要自己写前端，但是看到阿里的这些前端的各种各样的东西，有些实在找不到请求发出的文件，找不到具体哪个请求可能设置了 cookie 或 session，还有很多前端加密的东西也不是很熟

前端

请求

爬虫

urllib

34 条回复 • 2018-10-12 21:06:51 +08:00

hu0097

2017-09-19 13:01:07 +08:00

登录有加密的，刚入门搞不定的。用 selenium 吧

zgbgx1

2017-09-19 13:43:37 +08:00

@hu0097 不是刚入门，做过前后端开发

LukeChien

2017-09-19 14:12:36 +08:00

用 Chrome Headless

zgbgx1

2017-09-19 14:16:38 +08:00

@LukeChien 用 webdriver 就是另一种方式了

2017-09-19 15:00:40 +08:00

需要 selenium/chrome headless

shingle

2017-09-19 18:14:58 +08:00

完全模拟是几乎不可能的，光`ua`参数的加密就够你受的了

102400

2017-09-19 19:24:48 +08:00

搞定这个登录不会少于 1k 的，建议放弃或者直接找人买

zzNucker

2017-09-19 19:29:51 +08:00

1k 你想多了
起码 w 起

Tink

PRO

2017-09-19 19:54:43 +08:00 via iPhone

@102400 你确定 1k ？

regicide

2017-09-19 20:10:45 +08:00 via iPhone

去逆向网易有财的 app 包看他们怎么实现的

neoblackcap

2017-09-19 20:12:51 +08:00

干爬支付宝的早死了，第频率的还可，高频率的，技术封了，触发风控系统，做爬虫很难解决的。

binux

2017-09-19 20:16:46 +08:00

用 requests 写个代理，然后把浏览器设置到你代理上，这算不算「完全用 requests urllib 写出来」？

fiht

2017-09-19 21:22:53 +08:00

无法量化
成本过高
不如用印度云手工登录生成 cookie

wuhau

2017-09-19 22:30:10 +08:00

taobao 用 selenium，抓 cookie2，之前做淘宝客搞过这玩意。淘宝就不清楚了。

2017-09-19 23:13:53 +08:00 via Android

现在稍微登录情景有点不一样，就开始手机验证，地址验证，各种验证。。

LukeChien

2017-09-20 00:31:12 +08:00

起台虚拟机跑 Chrome Headless，可以搞

Luckyray

2017-09-20 00:53:29 +08:00 via iPhone

那个 ua 就卡死我了……

FanWall

2017-09-20 03:00:55 +08:00 via Android

来说一下～楼上 1w 也想多了，别说纯算法了，就是临时的解决方案也不是这个价格。
加密代码混淆且经常更新的，且都是业界顶级。
而且以支付宝的开发能力，我觉得这种前端加密在不远的未来就几乎无解：破了一个混淆？那我重新混淆下;破了混淆机制？那我换个混淆机制换个算法…
通用解决方案也许是对底层十分精通的人才能做到的吧。。写个专用的解释器出来？猜的。。。