Python中出现文本乱码如何解决

发布时间：2021-07-10 15:40:29 作者：Leah
来源：亿速云阅读：166

今天就跟大家聊聊有关Python中出现文本乱码如何解决，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

在处理utf8文本格式的时候，由于这些文本是含BOM(byte order mark)的utf8文本，编译时产生一个Error，”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原来，某些软件，如notepad，在保存一个以UTF-8编码的文件时，会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。因此我们在读取时需要自己去掉这些字符，Python中的codecs module定义了这个常量：

查看源代码打印帮助

import codecs   data = open("Test.txt").read()   if data[:3] == codecs.BOM_UTF8:   datadata = data[3:]   print data.decode("utf-8")

看完上述内容，你们对Python中出现文本乱码如何解决有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注亿速云行业资讯频道，感谢大家的支持。

Python中出现文本乱码如何解决

相关阅读