V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Ger2EX
V2EX  ›  Bash

# [求助] 用 curl 抓取一个网站,网站有很多分页,但不论怎么指 page=[2-100],抓取的都只是 page=1 的内容...

  •  
  •   Ger2EX · 2018-08-10 09:01:11 +08:00 · 5581 次点击
    这是一个创建于 2291 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人用 curl 抓取http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12内容; 但返回的始终是http://www.gmkfreefonts.com/index.php?letter=a&page=1&res=12的内容;

    浏览器 http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12 可以直接跳转到 page3

    curl -s http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12
    

    小白整了一晚也没整明白,请高手指点 1-2,谢谢!

    5 条回复    2018-08-10 10:56:15 +08:00
    zhu
        1
    zhu  
       2018-08-10 09:20:16 +08:00
    & 在命令行是特殊字符。

    你需要修改为:
    curl -s "http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12"
    beaconfire
        2
    beaconfire  
       2018-08-10 09:21:09 +08:00
    引号了解一下?
    iwishing
        3
    iwishing  
       2018-08-10 09:27:49 +08:00
    内容都在 index.php 里面了呀
    比方 aajaxsurrealfreak 字体,在第一页的第一个
    你在第三页的源文件里也能搜到
    presoul
        4
    presoul  
       2018-08-10 09:30:38 +08:00 via Android
    可以直接 f12 里面 copy as bash url
    Ger2EX
        5
    Ger2EX  
    OP
       2018-08-10 10:56:15 +08:00
    谢谢各位! OK
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2596 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 04:20 · PVG 12:20 · LAX 20:20 · JFK 23:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.