admin管理员组

文章数量:1610842

【UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence】的解决方案

  • 项目场景
  • 问题描述
  • 原因分析
  • 解决方案
  • End

项目场景

运行机器学习示例程序的时候提示错误:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence


问题描述

程序运行过程中出现:UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence


原因分析

使用Python的时候常见的文本的编码与解码问题。


解决方案

1)在打开文本的时设置其编码格式,如

open(‘test.txt’, encoding=’gbk’);

2) 若 1) 不能解决,可能是文本中出现的一些特殊符号超出了gbk的编码范围,可以选择编码范围更广的gb18030,如

open(‘test.txt’, encoding=’gb18030’);

3) 若 2) 仍不能解决,说明文中出现了连gb18030也无法编码的字符,可以使用ignore属性进行忽略,如

open(‘test.txt’, encoding=’gb18030’, errors=‘ignore’);

常见解决方法

open(‘test.txt’).read().decode(‘gb18030’, ’ignore’);

End

参考

https://blog.csdn/shijing_0214/article/details/51971734

本文标签: 解决方案CodecDecodeUnicodeDecodeErrorgbk