Python编码解码之encode()函数详解

encode

encode() 可以对字符串进行「编码」，常用来对「中文」字符串进行编码，以解决「乱码」问题。

语法

string.encode( encoding, errors )

参数

encodeing ：（可选）指定编码，默认 UTF-8
errors ：（可选）设置错误处理方式，默认

返回值

返回编码后的「新字符串」

实例：对字符串进行GBK编码

str1 = 'hello'
print(str1.encode('gbk'))

输出：

b'hello'

1、常见编码格式

ASCLL：美国早期制定的编码规范，只能表示128个字符。
GB2312：中国在ASCLL基础上对中文进行扩展，可以表示6763个汉字符号。
GBK：对GB2312的进一步扩展（K指扩），收录了21886个汉字符号。
GB18030：对GBK再一次扩充，收录了70244个汉字符号。
Unicode：字符集，包含了世界上目前所有的符号，全球的所有文字都可以解析，字符是定长的，统一为16位
UTF-8：使用最广的一种Unicode的实现方式，每次8个位传输数据；体积太大，国内通常使用GBK。
UTF-16：Unicode的另一种实现方式，每次传输16位数据

各个编码实例：

print('hello'.encode('gb2312'))
print('hello'.encode('gbk'))
print('hello'.encode('gb18030'))
print('hello'.encode('utf8'))
print('hello'.encode('utf16'))

输出：

b'hello'
b'hello'
b'hello'
b'hello'
b'\xff\xfeh\x00e\x00l\x00l\x00o\x00'

仔细观察返回结果就会发现，字符串前面都加了个b，接下来我们了解一下这是什么含义。

2、返回的是Bytes类型

encode() 编码后会返回一个「Bytes类型」的结果，而不是「str类型」

str1 = 'hello'
print(type(str1))
print(type(str1.encode()))

输出：

<class 'str'>
<class 'bytes'>

bytes 和 str 都属于字符串类型：

str 以Unicode code points形式存储(人认识的形式)
bytes 以byte形式存储(机器认识的形式)

bytes 是一个「二进制」序列对象，定义时在字符串前面加上b（英文可以，中文需要先encode）

str1 = b'hello'
print(type(str1))

输出：

<class 'bytes'>

3、错误处理方式

encode() 在编码时，经常会遇到「无法编码」的字符，这时就可以用 errors 设置适当的处理方式：

strict：失败时引发错误
ignore：忽略无法编码的字符
backslashreplace：用反斜杠替换无法编码的字符
namereplace：用解释字符的文本替换无法编码的字符
replace：用问号替换无法编码的字符
xmlcharrefreplace：用xml字符替换字符

如果给「两个参数」，可以自动按顺序复制给参数；如果只给「一个参数」，需要用参数名指定。

print('hello'.encode('gbk', 'strict'))
print('hello'.encode(errors='ignore'))
print('hello'.encode(errors='backslashreplace'))
print('hello'.encode(errors='namereplace'))
print('hello'.encode(errors='replace'))
print('hello'.encode(errors='xmlcharrefreplace'))

4、解码

decode() 会将「bytes类型」转成「str类型」，这意味着它只能解码bytes类型的字符串，解码str类型的字符串会报错 AttributeError: ‘str’ object has no attribute ‘decode’

bytes类型格式是 b'xxx'，如果只有str形式的字符串（比如 '\xe5\xbc\xa0\xe4\xb8\x89'），可以在前面加上b，变成bytes类型，再进行解码

print(b'\xe5\xbc\xa0\xe4\xb8\x89'.decode())

输出：

张三

总结

到此这篇关于Python编码解码之encode()函数的文章就介绍到这了,更多相关Python encode()函数内容请搜索本网站以前的文章或继续浏览下面的相关文章希望大家以后多多支持本网站！

您可能感兴趣的文章:

Python字符串的encode与decode研究心得乱码问题解决方法
python encode和decode的妙用
Python3中urlencode和urldecode的用法详解
Python中encode()方法的使用简介

Python编码解码之encode()函数详解

目录

encode

1、常见编码格式

2、返回的是Bytes类型

3、错误处理方式

4、解码

总结

2023年最新react面试题总结大全(附详细答案)

python实现自动更换ip的方法

Python中的for循环示例详解

可爱松鼠微信头像图片

Ghost安装器怎么安装Win10-Ghost安装器下安装Win10专业版系统详细图文教程

VUE3使用JSON编辑器的详细图文教程

iphone X如何关闭后台？苹果iphone X关闭软件后台方法介绍

Uint 和 int 的区别解析

Headshot插件如何使用-Headshot插件使用教程

Filecoin(FIL)是什么币？如何挖掘Filecoin

小米怎么设置声控相机？MIUI系统声控相机功能设置使用方法

Oracle ORA-00904-标识符无效解决方法(太坑了!!)

2014年全年公休假国务院放假安排时间表（5.1劳动节10.1国庆节中秋节放假安排时间表）

办公商务用笔记本电脑排名办公用笔记本电脑性价比排行榜

区块链PFP是什么意思？区块链PFP有什么价值？

-南京掌上公交-APP上线乘客以后可以掐点等公交

Golang依赖注入工具digo的使用详解

详解DES加密算法的原理与Java实现

solidwork中Floxpress怎么实现模拟流体-

快图浏览手机版怎么用快图浏览工具使用详细图文教程

Python编码解码之encode()函数详解

目录

encode

1、常见编码格式

2、返回的是Bytes类型

3、错误处理方式

4、解码

总结

2023年最新react面试题总结大全(附详细答案)

python实现自动更换ip的方法

Python中的for循环示例详解

可爱松鼠微信头像图片

Ghost安装器怎么安装Win10-Ghost安装器下安装Win10专业版系统详细图文教程

VUE3使用JSON编辑器的详细图文教程

iphone X如何关闭后台？苹果iphone X关闭软件后台方法介绍

Uint 和 int 的区别解析

Headshot插件如何使用-Headshot插件使用教程

Filecoin(FIL)是什么币？如何挖掘Filecoin

小米怎么设置声控相机？MIUI系统声控相机功能设置使用方法

Oracle ORA-00904-标识符无效解决方法(太坑了!!)

2014年全年公休假国务院放假安排时间表（5.1劳动节10.1国庆节中秋节放假安排时间表）

办公商务用笔记本电脑排名 办公用笔记本电脑性价比排行榜

区块链PFP是什么意思？区块链PFP有什么价值？

-南京掌上公交-APP上线 乘客以后可以掐点等公交

Golang依赖注入工具digo的使用详解

详解DES加密算法的原理与Java实现

solidwork中Floxpress怎么实现模拟流体-

快图浏览手机版怎么用 快图浏览工具使用详细图文教程

办公商务用笔记本电脑排名办公用笔记本电脑性价比排行榜

-南京掌上公交-APP上线乘客以后可以掐点等公交

快图浏览手机版怎么用快图浏览工具使用详细图文教程