zip解压后文件名乱码

解压zip文件后,中文文件名存在乱码问题解决方案

zipfile解压中文乱码问题解决

实用程序,解压中文乱码问题的解决

python 编码、解码原理的历史缘由

Python 3 查看字符编码方法

encode()和decode()的区别:
参考
Python3严格区分文本(str)和二进制数据(Bytes),文本总是Unicode,用str类型,二进制数据则用Bytes类型表示。
以Unicode表示的str通过encode()方法可以编码为指定的bytes

decode 指 解码:用于将 bytes 类型的二进制数据转换为 str 类型
encode 指 编码:用于将 str 类型转换成 bytes 类型

str和bytes之间的转换
str.encode(‘encoding’) -> bytes
bytes.decode(‘encoding’) -> str

注意:
str可以encode为Bytes,但是Bytes不一定可以decode为str。实际上Bytes.decode(‘latin1’)可以称为str,也就是说decode使用的编码决定了decode()的成败,同样的,UTF-8编码的Bytes字符串用GBK去decode()也会出错。

字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码, 即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。

【例 1】将 str 类型字符串“C语言中文网”转换成 bytes 类型:
>>> str = “C语言中文网”
>>> str.encode()
b’C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x91′

此方式默认采用 UTF-8 编码,也可以手动指定其它编码格式,例如:
>>> str = “C语言中文网”
>>> str.encode(‘GBK’)
b’C\xd3\xef\xd1\xd4\xd6\xd0\xce\xc4\xcd\xf8′

【例 2】
>>> str = “C语言中文网”
>>> bytes=str.encode()
>>> bytes.decode()
‘C语言中文网’

注意,如果编码时采用的不是默认的 UTF-8 编码,则解码时要选择和编码时一样的格式,否则会抛出异常,例如:
>>> str = “C语言中文网”
>>> bytes = str.encode(“GBK”)
>>> bytes.decode() #默认使用 UTF-8 编码,会抛出以下异常
Traceback (most recent call last):
File “”, line 1, in
bytes.decode()
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd3 in position 1: invalid continuation byte
>>> bytes.decode(“GBK”)
‘C语言中文网’

总的意思:想要将其他的编码转换成utf-8必须先将其解码成unicode然后重新编码成utf-8,它是以unicode为转换媒介的 如:s=’中文’ 如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。这种情况下,要进行编码转换,都需要先用 decode方法将其转换成unicode编码,再使用encode方法将其转换成其他编码。通常,在没有指定特定的编码方式时,都是使用的系统默认编码创建的代码文件

【参考】
两个差异
Python3的str 默认不是bytes,所以不能decode,只能先encode转为bytes,再decode
python2的str 默认是bytes,所以能decode

一个结论
所以str.decode 本质是bytes类型的str的decode
python3经常出现 AttributeError: ‘str’ object has no attribute ‘decode’

记忆小技巧
编码就是encode,把你认识的转为,机器人认识的
解码decode,就是吧一堆机器认识的,解释为人能读懂的

【参考1:encode与decode之间的转码详解】
【参考2:python3大作战之encode与decode讲解】

【python3 在Windows下的编码问题:encode 和 decode】

Python 3.X 乱码解决(一文搞定Python3.x 乱码问题)

Leave a Reply

Your email address will not be published.