Python中文
首页
教程
问答
标签
搜索
登录
注册
将两个UTF8字节相互拆分的有效方法
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个UTF-8字节<code>\xf0\x9f\x93\xb1\xf0\x9f\x9a\xac</code>,我想像<code>\xf0\x9f\x93\xb1</code>那样拆分它,<code>\xf0\x9f\x9a\xac</code>最有效的方法是什么</p> <p>我现在要做的是在<code>\xf0</code>分裂</p> <p><strong>问题</strong></p> <p>如果我按照bigOTHER的建议再次解码和编码,我会得到错误的字节</p> <pre><code>>>> s ='\xf0\x9f\x93\xb1\xf0\x9f\x9a\xac' >>> u = s.decode("utf-8") >>> u u'\U0001f4f1\U0001f6ac' >>> u[0].encode("utf-8") '\xed\xa0\xbd' >>> u[1].encode("utf-8") '\xed\xb3\xb1' >>> u[0] u'\ud83d' >>> u[1] u'\udcf1' </code></pre> <p><strong>已解决:</strong></p> <p>这是因为我的python是用UCS2而不是UCS4编译的,而UCS4是默认值。有关更多信息,请查看此<a href="https://stackoverflow.com/questions/33851069/decode-encode-utf-8-doesnt-lead-to-the-original-unicode">Question</a></p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用解码方法。它自己把它分成字节。因此,您可以访问后直接调用解码。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
3 回答
文本小部件:在没有输入时更新并在循环后保持空闲
2 回答
文本小部件tkin
1 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
1 回答
文本小部件tkinter复制图像选项
3 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
10 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
7 回答
文本小部件不显示lis中的内容
1 回答
文本小部件不显示Unicode字符
1 回答
文本小部件中写入的行间距
4 回答
文本小部件中的文本作为变量
9 回答
文本小部件中的滚动条仅显示在底部
5 回答
文本小部件中的选项卡键空间计数
4 回答
文本小部件作为Lis
10 回答
文本小部件在主框架中扩展列宽
9 回答
文本小部件未使用删除功能清除
4 回答
文本小部件滚动动画(Tkinter、Python)
1 回答
文本居中。格式正确吗?
5 回答
文本差分算法
10 回答
文本已知时音频文件中的单词索引
3 回答