playwright 通过有头浏览器能够获取文字内容,但是图片设置了防盗链
WARNING Failed to download image https://file.xxx.com/filex?fileId=OSS-33a46d7d-ed63-xxx-xx-xxxx.jpg&acl=xxx×tamp=13333333&uid=xxxx&fileName=&process=image/resize,w_1000,h_4096,m_lfit: Locator.click: Timeout 30000ms exceeded. Call log: waiting for get_by_text("Save image")
这个图片实际上是存在 oss 上的,通过浏览器 F12 看到地址是这样的,但是 python 调用的是是看不到这个地址的 https://xxxx.oss-xxx.aliyuncs.com/xxx/OSS-xxxxx-xxxx.jpg?Expires=13333333&OSSAccessKeyId=xxxxx&Signature=xxxx
如何通过 playwright 下载到这个照片?
![]() |
1
r6cb 19 天前
把完整请求头一起发过去,不是只访问链接
|
2
512357301 19 天前 via Android
你在追踪下,这种地址一般是存在属性里吧,或者通过 ajax 请求得到的,否则页面怎么加载出来。
|
![]() |
3
SanjinGG 18 天前
应该是有同源策略,只有他们网站可以访问。把图片转下 base64 ,然后再下载试试
|
4
gogoby 18 天前
启用 cdp network / fetch 方法 去抓 response (直接通过浏览器)
|