V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kastrcn
V2EX  ›  程序员

请问这是什么爬虫规则

  •  
  •   kastrcn · 2019-08-14 11:24:12 +08:00 · 2208 次点击
    这是一个创建于 1929 天前的主题,其中的信息可能已经有所发展或是发生改变。

    "class.xing_vb5.0@text"

    "class.xing_vb6.0@text|class.xing_vb7.0@text"

    "[email protected]@src"

    7 条回复
    kastrcn
        1
    kastrcn  
    OP
       2019-08-14 11:39:38 +08:00
    第一句话 是找到类为 xing_vb5 的第一个元素的内容

    求教这个爬虫规则什么是给什么框架的用的?
    DefineJ
        2
    DefineJ  
       2019-08-14 14:05:57 +08:00
    你这问的表示没看懂,我写了一个 php 爬虫用的 QueryList,规则
    $rules = array(
    '规则名' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
    '规则名 2' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
    ..........
    );
    还有其他很多,xpath 之类的
    tikazyq
        3
    tikazyq  
       2019-08-14 14:12:07 +08:00
    可以加作者 tikazyq1 拉爬虫管理平台微信群,很多大佬,帮你解决疑难杂症

    Crawlab Github: https://github.com/tikazyq/crawlab
    kastrcn
        4
    kastrcn  
    OP
       2019-08-14 15:34:47 +08:00
    @DefineJ 我感觉这个是一个类似 xpath 的那种爬虫框架的规则 网上找了一圈没发现是什么爬虫的框架框架 看看有没有见过识广的大佬见过 是什么爬虫框架
    kastrcn
        5
    kastrcn  
    OP
       2019-08-14 15:36:40 +08:00
    @tikazyq 已 star
    SoulMelody
        6
    SoulMelody  
       2019-08-14 16:51:08 +08:00
    这个好像安卓阅读 app 用的规则 https://github.com/gedoor/MyBookshelf
    kastrcn
        7
    kastrcn  
    OP
       2019-08-14 22:16:15 +08:00
    @SoulMelody 非常感谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1011 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 19:02 · PVG 03:02 · LAX 11:02 · JFK 14:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.