V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Mikahe
V2EX  ›  问与答

请问计算机二级网站这种反爬虫手段是什么,如何绕过?

  •  
  •   Mikahe · 2020-04-26 16:21:12 +08:00 · 2422 次点击
    这是一个创建于 1433 天前的主题,其中的信息可能已经有所发展或是发生改变。

    已知计算机二级网站网站为:

    http://search.neea.edu.cn/QueryMarkUpAction.do?act=doQueryCond&pram=results&community=Home&sid=300

    浏览器可以正常打开

    但是通过 python requests.get()打开为一个 js 脚本?

    请问这是个什么原理?

    9 条回复    2020-04-26 20:01:00 +08:00
    Mikahe
        1
    Mikahe  
    OP
       2020-04-26 16:24:37 +08:00
    而且是返回的是:返回状态 :412 Precondition Failed (接口异常,请检查接口异常日志)
    mlxj
        2
    mlxj  
       2020-04-26 16:25:44 +08:00
    一些信息没有加,比如 Referer
    eGlhb2Jhb2Jhbw
        3
    eGlhb2Jhb2Jhbw  
       2020-04-26 16:27:53 +08:00
    问题不知道,不过这网站是教育部的,搞的时候小心了
    Mikahe
        4
    Mikahe  
    OP
       2020-04-26 16:30:11 +08:00
    @mlxj 我的 referer 跟 chrome 上面的一模一样的
    yan5990853
        5
    yan5990853  
       2020-04-26 16:31:13 +08:00
    不怕出事?
    Mikahe
        6
    Mikahe  
    OP
       2020-04-26 16:31:56 +08:00
    @yan5990853 就想脚本查一下成绩,,,不会有太大流量的
    clague
        7
    clague  
       2020-04-26 16:34:10 +08:00 via Android
    可能是 js 脚本加载的,还是用 selenium 吧
    zdnyp
        8
    zdnyp  
       2020-04-26 16:43:43 +08:00
    盲猜是因为 cookies,而且要查询的话,你的目标页面也不是这个
    Mikahe
        9
    Mikahe  
    OP
       2020-04-26 20:01:00 +08:00
    @zdnyp 好像确实是因为 cookies,正在想办法
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2860 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 11:43 · PVG 19:43 · LAX 04:43 · JFK 07:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.