Python bytes类型及用法

1年前 (2024-04-28)

Python bytes 类型用来表示一个字节串。“字节串“不是编程术语,是我自己“捏造”的一个词,用来和字符串相呼应。

bytes 是 Python 3.x 新增的类型,在 Python 2.x 中是不存在的。

字节串(bytes)和字符串(string)的对比:

  • 字符串由若干个字符组成,以字符为单位进行操作;字节串由若干个字节组成,以字节为单位进行操作。

  • 字节串和字符串除了操作的数据单元不同之外,它们支持的所有方法都基本相同。

  • 字节串和字符串都是不可变序列,不能随意增加和删除数据。


bytes 只负责以字节序列的形式(二进制形式)来存储数据,于这些数据到底表示什么内容(字符串、数字、图片、音频等),完全由程序的解析方式决定。如果采用适的字符编码方式(字符集),字节串可以恢复成字符串;反之亦然,字符串也可以转换成字节串。

说白了,bytes 只是简单地记录内存中的原始数据,于如何使用这些数据,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不约束你的行为。

bytes 类型的数据非常适在互联网上传输,可以用于网络通信编程;bytes 也可以用来存储图片、音频、视频等二进制格式的文件。

字符串和 bytes 存在着千丝万缕的联系,我们可以通过字符串来创建 bytes 对象,或者说将字符串转换成 bytes 对象。有以下三种方法可以达到这个目的:
  • 如果字符串的内容都是 ASCII 字符,那么直接在字符串前面添加b前缀就可以转换成 bytes。
  • bytes 是一个类,调用它的构造方法,也就是 bytes(),可以将字符串按照指定的字符集转换成 bytes;如果不指定字符集,那么默认采用 UTF-8。

  • 字符串本身有一个 encode() 方法,该方法专门用来将字符串按照指定的字符集转换成对应的字节串;如果不指定字符集,那么默认采用 UTF-8。


【实例】使用不同方式创建 bytes 对象:

#通过构造函数创建空 bytes

b1 = bytes()

#通过空字符串创建空 bytes

b2 = b''

#通过b前缀将字符串转换成 bytes

b3 = b'http://c.biancheng网站站点" rel="nofollow" /> b3:  b'http://c.biancheng网站站点" rel="nofollow" />

#通过 decode() 方法将 bytes 转换成字符串

str1 = b5.decode('UTF-8')

print("str1: ", str1)

输出结果:

str1:  C语言中文网8岁了