admin管理员组

文章数量:1576280

学习xpath数据解析

安装的是最新版本的annoconda, 内部集成lxml版本4.6

pycharm会提示无法找到lxml.etree

调用也会出现错误XMLSyntaxError

解决方案: 

首先在https://www.lfd.uci.edu/~gohlke/pythonlibs/中选择相应lxml的版本

在相应的cd目录下

pip install lxml-4.8.0-cp39-cp39-win_amd64.whl

成功安装

 注意!

安装完毕后直接调用会报错

 据说是解析器无法解析不规范的html文件, 自己创建一个解析器就好了

增加parser参数

parser = etree.HTMLParser(encoding="utf-8")

成功解决问题!

 

本文标签: 版本方法PythonXPathetree