<div class="a">
<a href="123.jpg">sample</a>
</div>
假设有这样一个 html,我要提取 div 中间的 html 原文,如:
<a href="123.jpg">sample</a>
要这段 html 原文,而不是 text 之类的东西,这个该怎么做?
用了 xpath 停久了,第一次碰到这个需求,查了一圈关键字 xpath + html + 各种关键字结果都挺乱的,来 v2 请教一下。
1
jayong 2019-03-13 18:00:33 +08:00
//div[@class='a']
|
2
aaa5838769 2019-03-13 18:26:06 +08:00
//div[@class='a']/a/text() 不知道对不对,很久没用了
|
3
aaa5838769 2019-03-13 18:27:06 +08:00
当我上面语句没说- - 没仔细看完、
|
4
Nick2VIPUser 2019-03-13 18:31:53 +08:00 via iPhone 1
etree.tounicode()
etree.tostring() |
5
JCZ2MkKb5S8ZX9pq OP |
6
Lax 2019-03-13 21:05:13 +08:00
echo '<div class="a">
<a href="123.jpg">sample</a> </div>' | nokogiri -e 'puts $_.xpath("//div[@class=\"a\"]").inner_html' |