记录pyquery选取不到原生标签问题

编程入门 行业动态 更新时间:2024-10-28 12:24:30

记录pyquery选取不到原生<a href=https://www.elefans.com/category/jswz/34/1770160.html style=标签问题"/>

记录pyquery选取不到原生标签问题

今天在爬取马蜂窝评论信息的过程中,发现使用pyquery时,无论如何都选取不到源代码中的原生标签,如:

print(doc('._j_commentlist .rev-list li'))

如上,我们要选取 class属性为_j_commentlist的节点内class属性为rev-txt的节点内的li标签,发现选取不到,只通过属性来选取则可以成功选取。

搜索一番后,得到解决方案,原来pyquery默认以xmlns格式来解析源码,这导致我们选取不到原生标签。我们只需指定解析格式为html即可成功选取,如下所示:

doc = pq(html,parser='html')

更多推荐

记录pyquery选取不到原生标签问题

本文发布于:2023-07-28 15:43:13,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1239059.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:标签   pyquery

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!