python爬虫如何测试lxml

578次阅读
没有评论
python爬虫如何测试lxml

编程测试是一个重要环节,不然光写代码也是不行的,毕竟代码需要落实到实处才能产生价值。lxml获取网页的知识我们暂且不讲。喜欢实践的小伙伴一定不要错过今天的内容,测试还是非常有意思的。接下来小编带着大家一起l学习xml在python中的测试吧~

代码:

from lxml import etree
html = etree.parse('hello.html')
print type(html)
result = html.xpath('//li')
print result
print len(result)
print type(result)
print type(result[0])

运行结果

<type 'lxml.etree._ElementTree'>
[<Element li at 0x1014e0e18>, <Element li at 0x1014e0ef0>, <Element li at 0x1014e0f38>, <Element li at 0x1014e0f80>, <Element li at 0x1014e0fc8>]
5
<type 'list'>
<type 'lxml.etree._Element'>

可见,etree.parse 的类型是 ElementTree,通过调用 xpath 以后,得到了一个列表,包含了 5 个

  • 元素,每个元素都是 Element 类型 (2)获取
  • 标签的所有 class
result = html.xpath('//li/@class')
print result

运行结果

['item-0', 'item-1', 'item-inactive', 'item-1', 'item-0']

 

以上就是python爬虫中lxml测试的一些实例。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2021-06-01发表,共计733字。
新手QQ群:570568346,欢迎进群讨论 Python51学习