V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
whendada
V2EX  ›  Java

如何分析网页的 XHR 的 URL

  •  
  •   whendada · 2020-08-04 16:42:07 +08:00 · 2072 次点击
    这是一个创建于 1600 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,最近工作跟爬虫有关,有一部分是从网页的特定 XHR 中获得数据。想写一个通用的程序来实现,Java 语言。老大给我的方向是分析各个需要爬虫的网站的 xhr 的 url,但我看的一些网页中 url 的规律都不同,实在很困扰,特来求助,谢谢大家。

    5 条回复    2020-08-04 17:45:32 +08:00
    brazz
        1
    brazz  
       2020-08-04 17:05:15 +08:00
    先把浏览器的调试工具用好了
    LinsVert
        2
    LinsVert  
       2020-08-04 17:12:39 +08:00
    直接 python,用爬虫框架一下就出来了,url 用 xpath,regx 差不多就能出来了
    goofool
        3
    goofool  
       2020-08-04 17:15:24 +08:00
    下载一个 postman,开代理模式,然后导出 python 脚本美滋滋
    whendada
        4
    whendada  
    OP
       2020-08-04 17:44:47 +08:00
    @goofool OK 我看看,谢谢
    whendada
        5
    whendada  
    OP
       2020-08-04 17:45:32 +08:00
    @LinsVert 工作要求得用 Java,先看看你说的,谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2717 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:18 · PVG 16:18 · LAX 00:18 · JFK 03:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.