Python的字节编码，encode，decode，string，bytes，bytesarry区别

Python

Dev

发布日期: 2022-10-21

更新日期: 2024-04-01

文章字数: 793

阅读时长: 2 分

阅读次数:

**编码 (encode)**：将字符串 (str) 转换为字节 (bytes) 的过程。这涉及到使用特定的字符集（如UTF-8、ASCII等）将字符串中的每个字符转换为该字符集对应的字节。
**解码 (decode)**：将字节 (bytes) 转换回字符串 (str) 的过程。这同样涉及到使用特定的字符集。

例如：
```
s = "Hello, World!"
b = s.encode('utf-8')  # 编码: str -> bytes
new_s = b.decode('utf-8')  # 解码: bytes -> str
```

**string (str)**：
- 在Python 3中，字符串是Unicode字符的序列。这意味着你可以在字符串中使用世界上的任何字符，不仅仅是ASCII字符。
bytes：
- 字节是8位（或一个字节）的序列，范围从0到255。bytes对象是不可变的（即，不能更改）。
- 当你想操作二进制数据或与二进制格式（如网络协议或文件格式）交互时，通常会使用它。
bytearray：
- bytearray与bytes类似，但是bytearray是可变的。这意味着你可以更改其内容，而不必创建一个新的对象。
- 这在需要修改或操作二进制数据时很有用。
区别：
- str是用于文本数据的，而bytes和bytearray是用于二进制数据的。
- str与bytes之间的转换需要编码和解码过程。
- bytes是不可变的，而bytearray是可变的。

bytearray 是 Python 中的内置数据类型，用于表示可变的字节序列。与 bytes 类型相似，但主要的不同之处是它是可变的。以下是关于 bytearray 的详细说明：

**创建 bytearray**：

从一个字符串创建：

s = "Hello, World!"
ba = bytearray(s, 'utf-8')

从一个字节序列创建：
```
b = b"Hello, World!"
ba = bytearray(b)
```
创建一个特定大小的 bytearray，并用给定的值初始化（默认为0）：
```
ba = bytearray(10)  # 创建一个长度为10的bytearray，所有元素都是0
```

**修改 bytearray**：

由于 bytearray 是可变的，你可以更改其内容，添加或删除元素：

ba = bytearray(b"Hello")
ba[0] = 74  # 将首字节改为'J'
ba.append(33)  # 在末尾添加一个'!'的ASCII值

其他方法：
- append(): 在 bytearray 末尾添加一个字节。
- extend(): 扩展 bytearray，添加多个字节。
- insert(): 在指定位置插入一个字节。
- remove(): 删除第一个匹配的字节。
- pop(): 删除并返回指定位置的字节。
- index(): 查找字节并返回其第一个出现的位置。
- count(): 计算字节在 bytearray 中的出现次数。
- reverse(): 将 bytearray 中的元素反向排序。
- clear(): 清除所有字节。
与 bytes 的对比：
- bytes 是不可变的，而 bytearray 是可变的。
- 因此，bytes 适用于表示固定的字节序列，例如文件内容或网络包。而 bytearray 适用于需要更改或操作字节序列的场景。
注意事项：
- 当你修改 bytearray 时，要确保你插入的值在 0 到 255 之间，这是单个字节的有效范围。
- 尽管 bytearray 是可变的，但在需要的情况下也可以轻松地将其转换为 bytes 对象，例如 bytes(ba)。