Python打开读文件：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xed in position 7014: invalid conti|电子爱好者

admin管理员组
文章数量:1610842

1.问题：

Python用open()打开文件，读取其中内容时，报错说编码错误，'utf-8' 编码不能给字节0xed编码。

feed LM input feed file: ./data/raw/21000101.204243.txt
Traceback (most recent call last):
  File "run.py", line 9, in <module>
    traindata = load_data_in_cache()
  File "/data/deploy/wang/bertt/bigdata/feedrec/LM_embedding/gen_sample.py", line 20, in load_data_in_cache
    for line in input:
  File "/home/op_dev/wang/py3.6.12/lib/python3.6/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 7014: invalid continuation byte

另外一次报错：

feed LM input feed file: ./data/raw/21000101.210302.txt
Traceback (most recent call last):
  File "run.py", line 9, in <module>
    traindata = load_data_in_cache()
  File "/data/deploy/wang/bertt/bigdata/feedrec/LM_embedding/gen_sample.py", line 20, in load_data_in_cache
    for line in input:
  File "/home/op_dev/wang/py3.6.12/lib/python3.6/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 2824: invalid continuation byte

报错代码块：

    for input_feeds_file in file_path:
        with open(input_feeds_file) as input:
            for line in input:
                line = line.strip()
                ......

2.问题原因：

这是编码解码的问题，这个错误就是‘utf-8’不能解码位置2824的那个字节（0xed），也就是这个字节超出了utf-8的表示范围了.
换句话说，内容读取的时候发现了文件中存在utf-8不可编译的内容，所以我需要使用一种encoding来使文件能够被正常读取。

3.解决方法：

先看一步：在open()参数中增加了：encoding='unicode_escape'，解决上面的问题

    for input_feeds_file in file_path:
        with open(input_feeds_file, encoding='unicode_escape') as input:
            for line in input:
                line = line.strip()
                ......

又报了另外一个错误：

feed LM input feed file: ./data/raw/21000101.210302.txt
Traceback (most recent call last):
  File "run.py", line 9, in <module>
    traindata = load_data_in_cache()
  File "/data/deploy/wang/bertt/bigdata/feedrec/LM_embedding/gen_sample.py", line 20, in load_data_in_cache
    for line in input:
  File "/home/op_dev/wang/py3.6.12/lib/python3.6/encodings/unicode_escape.py", line 26, in decode
    return codecs.unicode_escape_decode(input, self.errors)[0]
UnicodeDecodeError: 'unicodeescape' codec can't decode byte 0x5c in position 8191: \ at end of string

问题原因：'unicodeescape'不能解码8191位置的0x5c.

查询了一下：要想彻底解决编码问题，直接用 encoding='ISO-8859-1'，目前不曾报错。
参考：

1.Unicode、UTF－8 和 ISO8859-1到底有什么区别：https://blog.csdn/robertcpp/article/details/7837712

本文标签：文件 Codec Decode UTF Python

版权声明：本文标题：Python打开读文件：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xed in position 7014: invalid conti 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728606040a1165466.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

1小时前

解决UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 85: illegal multibyte sequence 代码 in_fileopen(r

解答篇:完美解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 14

1小时前

文章目录一、解决问题二、解决步骤一、解决问题二、解决步骤

‘gbk‘ codec can‘t decode byte 0x80 in position 27: illegal multibyte sequenc

1小时前

错误代码示范 with open(".garbage_classifygarbage_classify_rule.json", 'r') as load_f:load_dict = json.lo

python 最新方案-解决编码错误问题：UnicodeEncodeError: 'ascii' codec can't encode characters in position

1小时前

文章目录问题描述：问题原因查找：1-定位str.decode(‘utf-8’)2-定位字符编码问题3-定位print问题-就是这个问题！ 解决问题方法参考问题描述&

UnicodeDecodeError gbk code cant decode byte 0xff in position 0 illegal multibyte sequence

1小时前

今天想打开C盘一个TXT结果这样报错，查到了解决办法： （1）、首先在打开文本的时候，设置其编码格式，如&

python open报错：‘gbk‘ codec can‘t decode byte 0xbd in position xxxx: illegal multibyte sequence

1小时前

python 打开文件： fopen(logpath, r)bufff.read()出错：UnicodeDecodeError: gbk codec cant decode byte

相信我，彻底解决UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa9 in position 7211: illegal multibyt

1小时前

相信大家在coding时候，尤其是在与文本打交道时候，经常会遇到类似这样的问题。问题截图那么通常你是怎么解决这个问题呢？我相信你肯定明白这是编码问题&#xff0

Python3遇到问题unicodeescape codec cant decode bytes in position 2 3 truncated UXXXXXXXX escape解决办法

1小时前

Python3 代码运行时遇到如下错误提示： SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq

1小时前

解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq 错误代码：

文件读写错误坑之UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position

1小时前

我们在使用open()来打开txt文件进行读写的时候，有时会产生这种报错，这通常是由于文件编码格式不一致导致的，因此我们在打开时要对文件加以编码限制：即

UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xf9 in position 53: illegal multibyte sequence

1小时前

使用python打开csv文件报错： UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xf9 in position 53: illegal multibyte s

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

1小时前

报错： 非法的多字节序列 UnicodeEncodeError: gbk codec cant encode character xf6 in position 156: illegal multibyte se

Python报错：‘latin-1‘ codec can‘t encode characters in position 48-56: ordinal not in range(256)

1小时前

报错信息： 原因： 因为 console 是字节流输出，Python 3 源码文件以 UTF-8 编码，所有字符串都是 unicode 字符串。注意

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

1小时前

python读取txt文件时报错： UnicodeDecodeError: gbk codec cant decode byte 0xab in position 43: illegal multibyte sequ

UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position ... 问题解决办法之一

1小时前

从网上抓了一些字节流，想打印出来结果发生了一下错误： UnicodeEncodeError: gbk codec cant encode character xbb in position 8

pip安装包时，出现UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 151:

1小时前

参考：https:my.oschinajms0755blog1612950?tdsourcetags_pctim_aiomsg

解决‘ascii‘ codec can‘t decode byte 0xe8 in position 0: ordinal not in range(128)

1小时前

一、问题解决这个报错是一个编码问题，我在网络上看到是版本的问题，但是我尝试了一下对于我的问题都没有解决，后来发现我只要在代码中加入一句 encodingiso-8859

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte

1小时前

【写在前面】今天在做说stm32和服务器之间的通信时因为编码格式问题导致了一些错误做个记录； 测试时搭载在云服务器上的python socket通讯模块数据接收部分代码如下： receive_

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

1小时前

1.问题描述 Windows环境下，打开cmd，然后运行Python命令，这个时候突然发现报错了，错误信息如下： Unicod

map文件的使用

42分钟前

开始接触MAP文件是在学习DSP时，后来发现微软PC下也存在MAP文件，所以查资料了解了下，记录一下方便大家和自己查看。首先说下TI DSP中的MAP文件&#xf

电子爱好者 - 最新技术资讯及电子产品介绍！

Python打开读文件：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xed in position 7014: invalid conti

1.问题：

2.问题原因：

3.解决方法：

更多相关文章

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

解答篇:完美解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 14

‘gbk‘ codec can‘t decode byte 0x80 in position 27: illegal multibyte sequenc

python 最新方案-解决编码错误问题：UnicodeEncodeError: 'ascii' codec can't encode characters in position

UnicodeDecodeError gbk code cant decode byte 0xff in position 0 illegal multibyte sequence

python open报错：‘gbk‘ codec can‘t decode byte 0xbd in position xxxx: illegal multibyte sequence

相信我，彻底解决UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa9 in position 7211: illegal multibyt

Python3遇到问题unicodeescape codec cant decode bytes in position 2 3 truncated UXXXXXXXX escape解决办法

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq

文件读写错误坑 之UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position

UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xf9 in position 53: illegal multibyte sequence

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

Python报错：‘latin-1‘ codec can‘t encode characters in position 48-56: ordinal not in range(256)

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position ... 问题解决办法之一

pip安装包时，出现UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 151:

解决‘ascii‘ codec can‘t decode byte 0xe8 in position 0: ordinal not in range(128)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

map文件的使用

发表评论

推荐文章

python+flask计算机毕业设计基于的电脑DIY微信小程序（程序+开题+论文）

未来十年Python的前景会怎样？

无线D.O.S攻击的常用方法

解决精灵标注助手暂不支持导入pascal文件

惠普Z820图形工作站安装WIN7以及出现的问题

热门文章

在计算机上知道手机密码,不知道密码查手机通话记录：傻瓜式教程

计算机d盘打开不显示,为何我打开电脑D盘显示不出任何东西来?

C盘太满扩容办法（超详细绝不骗人 谁都能也能轻易上手）

海马苹果助手ipad版_海马手机助手下载|海马手机助手 5.0.1 官方版

使用Nacos遇到io.netty.channel.AbstractChannel$AnnotatedConnectException: Connection timed out: no furthe

Excel：制作下拉选项

（十四）A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Seri

EditPlus激活码

position跟display、overflow、 float这些特性相互叠加后会怎么样?

惠普HP LaserJet Pro P1606dn 打印机驱动

最新文章

两个路由器的无线连接——FAST路由版

无线路由器组网方式：AP+AC、Mesh

家庭双路由器桥接实现方式（主TPLink + 副Fast）

关于多路由器桥接问题的解决

有线桥接，多个路由器共用一个WIFI

无线桥接两个路由器 实现全屋网络全覆盖

无线路由器进行无线桥接

无线桥接显示dhcp服务器没有开启,桥接提示“获取IP地址失败，请检查主路由器DHCP服务器是否开启”...

记一次配置路由器无线桥接的过程——让古董路由器发挥余热

解决两个无线路由器实现桥接和将无线路由器当做无线交换机使用

路由器AP、路由、桥接模式有什么区别

无线路由器桥接轻松学

路由器显示dhcp服务器连接失败怎么办,TP-Link路由器桥接提示“获取IP地址失败，请检查DHCP是否开启”怎么办...

什么无线桥接一直正在链接服务器失败,tplink无线桥接失败怎么办？

linux桥接wifi与有线,两个路由器有线桥接好还是无线桥接好？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

文件读写错误坑之UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position

C盘太满扩容办法（超详细绝不骗人谁都能也能轻易上手）

无线桥接两个路由器实现全屋网络全覆盖

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载