Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte|电子爱好者

admin管理员组
文章数量:1610857

在对一个网页进行爬取的时候，数据能取下来，最后解析的时候报错：

UnicodeDecodeError: 'utf8' codec can't decode byte 0xa4 in position 712: invalid start byte

意思是在进行解析的时候，使用utf8编码格式解析到712个字符的时候出错，去原网页F12，在Console中输入：document.charset，返回结果是GBK，表示该网页的编码格式是GBK，因此Python中应该使用GBK类解析，我这里使用的hyper，默认解析是utf8，我添加了参数，不让hyper帮我解析：

conn = HTTPConnection('www.hkex.hk:443')

conn.request('GET', '/chi/stat/smstat/dayquot/d210219c.htm', None, None)
resp = conn.get_response()
s = resp.read(decode_content=False)

可在响应读取数据处添加decode(encoding='UTF-8', errors='ignore')，解析成utf8，跳过出错的地方：

conn = HTTPConnection('www.hkex.hk:443')

conn.request('GET', '/chi/stat/smstat/dayquot/d210219c.htm', None, None)
resp = conn.get_response()
s = resp.read(decode_content=False).decode(encoding='UTF-8', errors='ignore')

但最好是按照原网页的数据进行解析，即转换为GBK：

conn = HTTPConnection('www.hkex.hk:443')

conn.request('GET', '/chi/stat/smstat/dayquot/d210219c.htm', None, None)
resp = conn.get_response()
s = resp.read(decode_content=False).decode(encoding='GBK', errors='ignore')

本文标签：报错 Codec Decode Python UnicodeDecodeError

版权声明：本文标题：Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728606341a1165504.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

UnicodeDecodeError gbk code cant decode byte 0xff in position 0 illegal multibyte sequence

1小时前

今天想打开C盘一个TXT结果这样报错，查到了解决办法： （1）、首先在打开文本的时候，设置其编码格式，如&

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

1小时前

运行python程序时出现以下错误： UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 0: ordinal not in ra

解决UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe5 in position 108: ordinal not in range(128

1小时前

解决UnicodeDecodeError: ascii codec cant decode byte 0xe5 in position 108: ordinal not in range(128) 混淆了 python2 里边的 str

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq

1小时前

解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq 错误代码：

python读取字符报错：‘utf-8‘ codec can‘t decode byte 0xbd in position 2: invalid start byte

1小时前

python读取字符报错:utf-8 codec cant decode byte 0xbd in position 2: invalid start byte 原因解决方法原因 utf-8只包含了部分汉字，导致解

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc9 in position 0: invalid continuation byte！！！

1小时前

前言最近在学习Django时遇到了一个错误，特别的讨厌，找了许多教程，许多方案都没有解决，最终在一位学长的带领下成功的找出了错误&#xff0

Python报错：‘latin-1‘ codec can‘t encode characters in position 48-56: ordinal not in range(256)

1小时前

报错信息： 原因： 因为 console 是字节流输出，Python 3 源码文件以 UTF-8 编码，所有字符串都是 unicode 字符串。注意

python读取文件时报错，‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

1小时前

具体错误如下：utf-8 codec cant decode byte 0xb1 in position 0: invalid start byte 解决方法： dfpd.read_csv

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

1小时前

python读取txt文件时报错： UnicodeDecodeError: gbk codec cant decode byte 0xab in position 43: illegal multibyte sequ

解决：UnicodeEncodeError: ‘charmap‘ codec can‘t encode characters in position 11-14:character maps to ＜

1小时前

#CE测试执行工具打开runner.py报错信息：UnicodeEncodeError: ‘charmap’ codec can’t encode characters in position 11-14: chara

UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position ... 问题解决办法之一

1小时前

从网上抓了一些字节流，想打印出来结果发生了一下错误： UnicodeEncodeError: gbk codec cant encode character xbb in position 8

Python2.x编码问题：UnicodeDecodeError: 'ascii' codec can't decode byte in position : ordinal not in range

1小时前

Python2.x的默认字符集编码是ASCII，包含的字符有限，因此会有很多字符集的问题。问题原因真相只有一个：.py文件的某个字节，超出了ASCII表达的范围。每个字节是8 bit、理论上可以表示256个字符。但标准ASCII

(unicode error) 'unicodeescape' codec can't decode bytes in position 12-13: truncated UXXXXXXXX esc

1小时前

(unicode error) ‘unicodeescape’ codec can’t decode bytes in position 12-13: truncated UXXXXXXXX escape 用python代码读取桌面文件

Python-logging报错解决：UnicodeEncodeError: 'gbk' codec can't encode character 'u' in position: illegal

1小时前

我在Python3 中使用Logging模块把日志打到终端输出时会报错。代码如下： import logginglogging.basicConfig(level=logging.INFO,filename='log.log

python2（中文编码问题）：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 1

1小时前

转载 https:wwwblogswalk1314p7251126.html python在安装时，默认的编码是ascii，当程序中出现非ascii编码时，pyt

解决‘ascii‘ codec can‘t decode byte 0xe8 in position 0: ordinal not in range(128)

1小时前

一、问题解决这个报错是一个编码问题，我在网络上看到是版本的问题，但是我尝试了一下对于我的问题都没有解决，后来发现我只要在代码中加入一句 encodingiso-8859

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

1小时前

1.问题描述 Windows环境下，打开cmd，然后运行Python命令，这个时候突然发现报错了，错误信息如下： Unicod

提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 44: illegal multibyte sequenc

1小时前

若尝试以下无效函数(地址,encodingUTF-8) 重启spyder可能有效根本解决方法是： 修改文件C or D:****Anaconda3libsite-packagesspyder_ker

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)

1小时前

在linux（ubuntu）下，输出文字时报错UnicodeEncodeError: ‘ascii’ codec can’t encode characters in pos

惠普主机做完系统报错“选定的启动映像未通过身份验证”

1小时前

搜了一堆资料折腾半天，发现官网的教程最靠谱。 https:support.hpcn-zhdocumentc05194536

电子爱好者 - 最新技术资讯及电子产品介绍！

Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte

更多相关文章

UnicodeDecodeError gbk code cant decode byte 0xff in position 0 illegal multibyte sequence

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

解决UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe5 in position 108: ordinal not in range(128

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq

python读取字符报错：‘utf-8‘ codec can‘t decode byte 0xbd in position 2: invalid start byte

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc9 in position 0: invalid continuation byte！！！

Python报错：‘latin-1‘ codec can‘t encode characters in position 48-56: ordinal not in range(256)

python读取文件时报错，‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

解决：UnicodeEncodeError: ‘charmap‘ codec can‘t encode characters in position 11-14:character maps to ＜

UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position ... 问题解决办法之一

Python2.x编码问题：UnicodeDecodeError: 'ascii' codec can't decode byte in position : ordinal not in range

(unicode error) 'unicodeescape' codec can't decode bytes in position 12-13: truncated UXXXXXXXX esc

Python-logging报错解决：UnicodeEncodeError: 'gbk' codec can't encode character 'u' in position: illegal

python2（中文编码问题）：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 1

解决‘ascii‘ codec can‘t decode byte 0xe8 in position 0: ordinal not in range(128)

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

提示&quot;UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 44: illegal multibyte sequenc

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)

惠普主机做完系统报错“选定的启动映像未通过身份验证”

发表评论

推荐文章

手把手教你一键免费激活IDM下载工具（已支持最新版6.42）

专升本英语6套学习笔记和三套模拟试卷

Wins10系统忘记开机密码快速解锁方法（图文教程）

excel android vba,你加班1小时做Excel表格，我用VBA只需1分钟！(免费领教程)

Multicarrier Interpretation of OTFS（OTFS的多载波解释）（7）⭐

热门文章

http 连接复用

su: Authentication failure问题解决方式

windows如何截屏

C++指向对象成员函数的指针

手机淘宝列表页面 的js调用展示

【excel技巧】如何在Excel表格中添加选项按钮？

在Excel中批量生成送货单，按数据类别批量生成产品标签

手机ROOT,ROOT的优缺点

彻底理解粘性定位（position：sticky）

Unexpected token c in JSON at position XX at JSON.parse关于JSON.parse方法报错

最新文章

无线桥接后让副路由DHCP分配IP地址的技巧

用2个无线路由器桥接实现扩大无线范围方法

使用新路由器有线无线桥接旧路由器

路由器作为网络扩展器——设置桥接、路由模式

使用多个路由器有线桥接实现无线漫游

把树莓派改造成无线软路由器(1)-----桥接模式(无线AP接入点)

家用无线路由器如何用网线桥接解决有些房间无线信号覆盖不好的问题（低成本）

磊科Netcore路由器无线无缝中继(桥接)设置方法

mw320r虚拟服务器,水星MW320R路由器桥接设置上网方法

无线路由器桥接的设置

华为AX3 PRO路由器与光猫桥接

新路由器与老路由器之间的无线桥接

路由器桥接方式

d-link路由器虚拟服务器,两台D-Link路由器之间如何桥接上网

【闲置路由器的有效利用】路由器有线桥接实现无线漫游

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 44: illegal multibyte sequenc

手机淘宝列表页面的js调用展示

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载