首页教程专区正文内容

python乱码转码_Python解决乱码问题

教程专区

2024-02-07 04:36:07

编码字符串输出乱码字节代码不能

python乱码转码_Python解决乱码问题

解决python乱码问题

字符串在python的内部采⽤unicode的编码⽅式，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码(decode)成unicode，再从unicode编码(encode)成另⼀种编码。编码是⼀种⽤⼆进制数据表⽰抽象字符的⽅式，utf8是⼀种编码⽅式。

代码中的字符串编码默认和代码⽂件编码相同。

decode的作⽤是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表⽰将gb2312编码的字符串str1转换成unicode编码。

encode的作⽤是将unicode编码转换成其他编码的字符串，如de('gb2312')，表⽰将unicode编码的字符串str2转换成

gb2312编码。

因此，转码的时候⼀定要先搞明⽩，字符串str是什么编码，然后decode成unicode，然后再encode成其他编码

python2中的unicode和python3中的str等价。可以查看s.__class__，如果为则为unicode编码及⽂本数据，如果为则为utf8编码及⼆进制数据。str(s, 'utf8')和s.decode('utf8')等价。

如果字符串在代码中被定义为s=u'中⽂'，则s就是python内部编码unicode。

unicode类型再解码会报错。

判断⼀个字符串是否为unicode⽅法isinstance(s, unicode)，python2中的unicode和python3中的str等价，所以在python3中判断⼀个字符串是否为unicode⽅法为isinstance(s, str)。

获取系统默认编码：

defaultencoding())

有些IDE输出乱码是因为控制台不能输出字符串的编码，这倒不是程序本⾝的问题。⽐如windows的控制台是gb2312编码⽅式，则utf8的输出格式不能正确输出。

⼀种输出格式为gb2312避免乱码的⽅式(如果不确定是哪种编码格式，可以使⽤⼀下的通⽤形式去处理)：

#coding=utf-8

s='中⽂'

if(isinstance(s, str)):#s为u'中⽂'

s.decode('utf8').encode('gb2312')

采⽤标准库codecs模块

codecs.open(filename, mode='r', encoding=None, errors='strict', buffering=1)importcodecs

unicode编码转换二进制

f= codecs.open(filename, encoding='utf-8')

使⽤上边这种⽅式读进来utf-8⽂件，会⾃动转换为unicode。但必须明确该⽂件类型为utf8类型。

如果是⽂件中有汉字，不是⼀个字节⼀个字节地读⽽是整个汉字的所有字节读进来然后转换成unicode(猜想跟汉字的utf8编码有关)。

下边的代码也是⼀种使⽤codecs的读写⽅式

#coding=utf-8

importcodecs

fin= open("", 'r')

fout= open("", 'w')

reader= ader('gbk')(fin)

writer= writer('gbk')(fout)

data= ad(10)#10是最⼤字节数，默认值为-1表⽰尽可能⼤。可以避免⼀次处理⼤量数据whiledata:

writer.write(data)

data= ad(10)

Unicode了解一下:编码算法

« 上一篇

编码的物理学原理与应用

下一篇 »

发表评论

推荐文章

智能平板电脑作文500字

基地地Genesis Prime XL EGS102用户手册说明书

我的发明400字作文智能平板

平板的功能与使用方法作文

关于平板电脑的作文700字左右

热门文章

合理使用网络避免网瘾的倡议书英语作文
2024-05-21
任何正确使用平板电脑的英语作文
2024-05-21
英语介绍一个事物五年级上册作文
2024-05-21
平板电脑介绍英语作文
2024-05-21
iphone的safari浏览器中实现全屏浏览的方法
2024-05-21
英语作文关于介绍平板电脑词数80
2024-05-21
家庭中的技术英语作文150字左右
2024-05-21
英语作文演讲稿关于使用电子产品
2024-05-21
对网络阅读和纸质阅读的看法英语作文
2024-05-20
拒绝手机诱惑,健康学习生活的英语作文
2024-05-20
数字阅读还是电子阅读的英语作文
2024-05-20
以小孩禁止玩平板为话题写一篇英文作文
2024-05-20
爱护眼睛小学英语作文
2024-05-20
狮子作文之狮子林英文导游词
2024-05-20
2019北师大版教材book2unit4听力文本和课文word版
2024-05-20
锦江区2022中考英语一诊试卷
2024-05-20
2022-2023学年全国初中中考专题英语牛津译林版中考真卷(含答案解析考点...
2024-05-20
2020国开专科理工英语2网上形考自测试卷及答案
2024-05-20
电子阅读与纸质阅读的利与弊英语作文
2024-05-20
英语排序题专题及答案
2024-05-20

最新文章

标签列表