V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wdssmq
V2EX  ›  站长

超级奇怪的爬虫!

  •  
  •   wdssmq · 2021-06-22 12:07:56 +08:00 · 1697 次点击
    这是一个创建于 1254 天前的主题,其中的信息可能已经有所发展或是发生改变。

    博客有用插件记录进入 404 的访问然后输出成 RSS,今天出现了一堆奇怪的访问:

    /tag/MySQL/zqxjuAaoYnUufB.html
    /category/说点什么 /zqxjuAaoYnUufB.html
    /tag/折腾 /zqxjuAaoYnUufB.html
    /date/2014-05-12/zqxjuAaoYnUufB.html
    

    所以页面中出现过的网址目录,都拼接了如上文件名访问,包括一些 JS 或 CSS 的引入路径。

    下边网址内是截图:

    沉冰浮水:“#PubWord 这个神秘字符串是啥意思? zqxjuAaoYnUufB” - 呜呜 w(> ʌ <)w

    https://wxw.moe/@wdssmq/106452341395928554

    访问 IP 也不固定

    其中一个:

    128.31.0.13 Mozilla/5.0 (Windows NT 6.1; rv:45.0) Gecko/20100101 Firefox/45.0

    3 条回复    2021-06-30 09:30:05 +08:00
    delectate
        1
    delectate  
       2021-06-22 12:58:53 +08:00
    还别说,google 搜全网也只有这个帖子。

    看起来不像是随机字符串,base64 也乱码。可能是其他博客类似的 url,触发了爬虫的某个行为模式。
    sworgod
        2
    sworgod  
       2021-06-30 08:58:57 +08:00 via Android
    这个一看就像是黑客在扫描你网站呀。很典型,用代理 ip,扫描关键目录
    wdssmq
        3
    wdssmq  
    OP
       2021-06-30 09:30:05 +08:00
    zqxjAucbeTECbh

    zqxjlHlllOrZMd

    ↑↑ 补充
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1039 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 20:05 · PVG 04:05 · LAX 12:05 · JFK 15:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.