Python中的二进制到字符串/文本

网友

1楼 · 编辑于 2024-09-28 21:53:41

看起来您正在尝试从每个字符的二进制字符串表示（位字符串）中解码ASCII字符。

您可以取八个字符（一个字节）的每个块，将其转换为整数，然后使用chr()将其转换为字符：

>>> X = "0110100001101001"
>>> print(chr(int(X[:8], 2)))
h
>>> print(chr(int(X[8:], 2)))
i

假设字符串中编码的值是ASCII，这将为您提供字符。你可以这样概括：

def decode_binary_string(s):
    return ''.join(chr(int(s[i*8:i*8+8],2)) for i in range(len(s)//8))

>>> decode_binary_string(X)
hi

如果你想保持原来的编码，你不需要再解码了。通常您会将传入的字符串转换为Pythonunicode字符串，可以这样做（Python 2）：

def decode_binary_string(s, encoding='UTF-8'):
    byte_string = ''.join(chr(int(s[i*8:i*8+8],2)) for i in range(len(s)//8))
    return byte_string.decode(encoding)

网友

2楼 · 编辑于 2024-09-28 21:53:41

提供要转换的int的可选基参数：

>> x = "1000100100010110001101000001101010110011001010100"
>> int(x, 2)
301456912901716

网友

3楼 · 编辑于 2024-09-28 21:53:41

在Python 2中，ascii编码（字节）字符串也是utf8编码（字节）字符串。在Python 3中，（unicode）字符串必须编码到utf8编码字节。解码的例子走错了路。

>>> X = "1000100100010110001101000001101010110011001010100"
>>> X.encode()
b'1000100100010110001101000001101010110011001010100'

仅包含数字“0”和“1”的字符串是一种特殊情况，适用相同的规则。

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中的二进制到字符串/文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >