Python中文
首页
教程
问答
标签
搜索
登录
注册
Unicode、Python3和程序员之间的又一场战斗。解码字符串
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>问题是将字节转换为unicode,而这些字节已经保存在字符串中。举个例子:</p> <pre><code>s1 = '\xd0\xb1\xd0\xb0' s2 = b'\xd0\xb1\xd0\xb1' print(s1) # Here is the problem: prints a trash (аб) print(s2.decode('utf-8')) # Everything is OK, printing 'ба' (two cyrillic symbols) </code></pre> <p>我现在能解码多强?我不能在<strong>s1</strong>声明之前添加<strong>b'</strong>修饰符,因为<strong>s1</strong>可能来自互联网,所以我不能像声明<strong>s2</strong>那样声明<strong>s1</strong>。 我发现<strong>b'</strong>修饰符的工作方式类似于<strong>bytes()</strong>函数,但是当我试图调用它时:</p> <pre><code>s3 = bytes(s1, 'utf-8') </code></pre> <p>又有垃圾了:</p> <pre><code>print(s3.decode('utf-8')) # аб </code></pre> <p>所以问题是:</strong>我应该怎么处理s1,使它成为终端输出中的“ба”?你知道吗</p> <p>我在谷歌上搜索了很多,但我发现的并不是我需要的。你知道吗</p> <p>这就是我需要的:</p> <pre><code>s4 = SOME_WONDERFUL_MAGIC(s1) print(s4) # Prints 'ба' </code></pre> <p>非常感谢所有能帮助我的人,请原谅我的英语不好。你知道吗</p> <p><strong>更新:</strong>哦,问题返回了。我希望第一个答案能对我有所帮助,但我发现:</p> <pre><code>s1 == '\xd0\xb1\xd0\xb0' # BUT s1 != '\xd0\xb1\xd0\xb0' </code></pre> <p>我的意思是: 我使用“requests”包向Flask服务器发出POST请求。它回答我:</p> <pre><code>req = requests.post(hostName) print(req.text) # b'testText' # BUT! print(req.text[2:-1] # testText </code></pre> <p>这意味着testText的字节表示形式是字符串,如下所示:</p> <pre><code>s5 = "b'tumba'" </code></pre> <p>所以真正的问题是:如何从“b'tumba”中提取tumba(如果tumba可能包含西里尔文符号)?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>对我有效的快速而肮脏的解决方案:</p> <pre><code>s1 = '\xd0\xb1\xd0\xb0' s4 = bytes(s1, encoding='latin1').decode('utf-8') print(s4) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
1 回答
文本小部件:在没有输入时更新并在循环后保持空闲
5 回答
文本小部件tkin
1 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
2 回答
文本小部件tkinter复制图像选项
10 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
6 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
5 回答
文本小部件不显示lis中的内容
6 回答
文本小部件不显示Unicode字符
2 回答
文本小部件中写入的行间距
8 回答
文本小部件中的文本作为变量
2 回答
文本小部件中的滚动条仅显示在底部
2 回答
文本小部件中的选项卡键空间计数
9 回答
文本小部件作为Lis
1 回答
文本小部件在主框架中扩展列宽
10 回答
文本小部件未使用删除功能清除
4 回答
文本小部件滚动动画(Tkinter、Python)
3 回答
文本居中。格式正确吗?
6 回答
文本差分算法
10 回答
文本已知时音频文件中的单词索引
1 回答