2019-05-05 16:08:55 2974瀏覽
本篇文章扣丁學(xué)堂Python培訓(xùn)小編給讀者們分享一下Python lxml解析HTML并用xpath獲取元素的方法,文中有代碼列出供小伙伴們參加學(xué)習(xí),對Python開發(fā)感興趣的小伙伴就隨小編來了解一下吧,希望對大家有所幫助。
使用方法見注釋
#-*- coding: UTF-8 -*-
from lxml import etree
source = u'''
<div><p class="p1" data-a="1">測試數(shù)據(jù)1</p>
<p class="p1" data-a="2">測試數(shù)據(jù)2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">測試數(shù)據(jù)3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
圖片</p>
'''
# 從字符串解析
page = etree.HTML(source)
# 元素列表
ps = page.xpath("http://p")
for p in ps:
print u"屬性:%s" % p.attrib
print u"文本:%s" % p.text
# 文本列表
ts = page.xpath("http://p/text()")
for t in ts:
print t
# xpath定位
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
print l.attrib
最后想要了解更多關(guān)于Python和人工智能方面內(nèi)容的小伙伴,請關(guān)注扣丁學(xué)堂Python培訓(xùn)官網(wǎng)、微信等平臺(tái),扣丁學(xué)堂IT職業(yè)在線學(xué)習(xí)教育平臺(tái)為您提供權(quán)威的Python開發(fā)環(huán)境搭建視頻,Python培訓(xùn)后的前景無限,行業(yè)薪資和未來的發(fā)展會(huì)越來越好的,扣丁學(xué)堂老師精心推出的Python視頻教程定能讓你快速掌握Python從入門到精通開發(fā)實(shí)戰(zhàn)技能??鄱W(xué)堂Python技術(shù)交流群:279521237。
【關(guān)注微信公眾號(hào)獲取更多學(xué)習(xí)資料】 【掃碼進(jìn)入Python全棧開發(fā)免費(fèi)公開課】