admin管理员组文章数量:1611167
解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
错误代码:
with open("baidu.html",'w+') as f:
f.write(results.text)
正确代码:
with open("baidu.html",'w+',encoding="utf-8") as f:
f.write(results.text)
在抓取网页上面的一些源代码的时候,将uft-8的编码写入文档,并输出的时候,出现这了这个报错,说gbk无法编码\xbb
查找相关资料:
1.str转bytes叫encode,bytes转str叫decode
2.字符就是unicode字符,字符串就是unicode字符数组
原来,open()函数的默认编码不是utf-8,修改编码方式即可
write()函数涉及的问题,那就是它的参数必须是str,不能是bytes,也就是说f.write(result)中的result参数如果是bytes需要先decode成str(比如result.decode(‘utf-8’)),才能使用open()函数的encoding
本文标签: encodecharacterCodecUnicodeEncodeErrorgbk
版权声明:本文标题:UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xe7‘ in position 295: illegal multibyte seq 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1728607126a1165596.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论