admin管理员组

文章数量:1612060



已解决(Python读取csv文件报错)UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte






文章目录

  • 报错代码
  • 报错翻译
  • 报错原因
  • 解法方法
  • 千人全栈VIP答疑群联系博主帮忙解决报错






报错代码



粉丝群里面的一个小伙伴想用pandas读取csv文,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:



import pandas as pd
import numpy as np

df = pd.read_csv('test.csv')
print(df)



报错信息:


UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte





报错翻译



报错内容翻译

编码解码错误:“utf-8”编解码器无法解码位置0中的字节0xa1:起始字节无效



报错原因



报错原因:CSV文件不是UTF-8进行编码,而是用gbk进行编码的。





解法方法



解决方法(1):

  • 1.选中csv文件 -》鼠标右键 -》打开方式 -》 选择记事本

  • 2.打开文件选择 “文件” -》"另存为“,我们可以看到默认编码是:ANSI


  • 3. 选择UTF-8点击保存,再使用再次运行程序就不会报错了

解决方法(2):修改代码的编码格式为gbk


import pandas as pd
import numpy as np

df = pd.read_csv('test.csv',encoding="gbk")
print(df)

再次运行成功:




以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!

千人全栈VIP答疑群联系博主帮忙解决报错

由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn/yuan2019035055/category_11466020.html

  • 优点作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!

  • 专栏福利简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等


免费资料获取,更多粉丝福利,关注下方公众号获取

本文标签: CodecDecodeUnicodeDecodeErrorUTFbyte