V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
foxyier
V2EX  ›  Python

[求助帖]xpath 语法中的模糊匹配 contains

  •  
  •   foxyier · 2018-11-19 17:42:07 +08:00 · 3228 次点击
    这是一个创建于 2226 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我想通过模糊匹配, 取出某节点的某属性包含指定数据, 可是通过"//*[contains(@*, 'jpg')]"取出的却是空。 请问需要怎么做呢? 其中"//*"是符合要求的, 只有 contains 中的 @*貌似是有问题的, 求助
    7 条回复    2018-11-20 11:10:16 +08:00
    JCZ2MkKb5S8ZX9pq
        1
    JCZ2MkKb5S8ZX9pq  
       2018-11-19 18:44:47 +08:00
    属性可以为*吗?图片的话你直接写 img 和 @src 能获取到嘛?
    111qqz
        2
    111qqz  
       2018-11-19 19:14:42 +08:00 via Android
    或许应该是'*.jpg' ?
    ioven
        3
    ioven  
       2018-11-19 19:25:40 +08:00
    lxml 可以提取,将节点转成 html,然后正则提取效果更好
    Northxw
        4
    Northxw  
       2018-11-19 20:39:37 +08:00
    contains 是做属性匹配的, 你这'jpg' 是个啥属性?
    foxyier
        5
    foxyier  
    OP
       2018-11-20 11:08:06 +08:00
    @JCZ2MkKb5S8ZX9pq 如果取的是图片, 直接写 img 和 @src,是可以获取到的, 但是 @*无法获取
    foxyier
        6
    foxyier  
    OP
       2018-11-20 11:09:02 +08:00
    @Northxw 因为 jpg 一般是 img 标签中 src 属性的值, 我想模糊匹配某个标签中某个属性包含我想要的值, 可是 @*不支持
    foxyier
        7
    foxyier  
    OP
       2018-11-20 11:10:16 +08:00
    @111qqz 我不确定是在哪个属性中, 根据测试初步推断是 @*的问题,这里不太清楚怎么写。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1075 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 19:10 · PVG 03:10 · LAX 11:10 · JFK 14:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.