V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
wuming
V2EX  ›  问与答

scrapy 中使用 Selector 的 xpath 表达式如何选择具有相同 html 标签的元素的内容

  •  
  •   wuming · 2014-09-26 21:37:39 +08:00 · 4475 次点击
    这是一个创建于 3739 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如: http://emall.chblt.com/Product/ProductDetail.aspx?itemcode=6627200055

    我想获得该页面产品简介的内容,但是产品简介所嵌套的div标签并没有任何的id或者class,它的平级还有好几个并列的div,请问xpath表达式是否可以在有几个相同标签的情况下获取到第N个标签元素的写法?或者这个问题是否还有其他方法可以解决。谢谢?
    4 条回复    2014-09-27 16:25:55 +08:00
    wuming
        1
    wuming  
    OP
       2014-09-26 22:52:19 +08:00
    目前采用的方法是获取所有相同的标签然后遍历,有更简单的方法么
    ZzFoo
        2
    ZzFoo  
       2014-09-27 10:11:31 +08:00   ❤️ 1
    Xpath取到的是节点列表,也就说是个list,直接用下标取就行了,比如如果是第三个就是div[2]
    Battle
        3
    Battle  
       2014-09-27 10:40:43 +08:00 via iPad
    @ZzFoo 如果有些内容要有些不要呢?我爬下来会两行空白一行文字这样子循环
    ZzFoo
        4
    ZzFoo  
       2014-09-27 16:25:55 +08:00
    @Battle 用string类自带的方法strip()

    >>> ' \n \nabc'.strip()
    'abc'
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2529 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 04:19 · PVG 12:19 · LAX 20:19 · JFK 23:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.