Python中文
首页
教程
问答
标签
搜索
登录
注册
拆分ascii/unicode字符串
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我试图用python解码ID3v2(MP3头)协议。要解码的数据格式如下。在</p> <p><code>s1</code>,<code>s2</code>。。。<code>sn-1</code>是unicode(utf-16/utf-8)字符串,最后一个字符串“sn”可以是unicode或二进制字符串。在</p> <pre><code>data = s1+delimiters+s2+delimiters+...+sn </code></pre> <p>其中,utf-16的分隔符是<code>'\x00'+'\x00'</code> utf-8的分隔符是<code>'\x00'</code></p> <p>我得到<code>data</code>和unicode类型。现在我必须提取所有字符串(<code>s1</code>,<code>s2</code>。。。<code>sn</code>)来自<code>data</code>。为此,我使用<code>split()</code>,如下所示</p> ^{pr2}$ <p>输出:</p> <pre><code>['Hello', 'world'] ['\xff\xfeH\x00e\x00l\x00l\x00o', '\x00\xff\xfew\x00o\x00r\x00l\x00d\x00'] </code></pre> <p>它适用于set-1数据,但不适用于set-2。 因为“数据”在集合2中</p> <pre><code>'\xff\xfeH\x00e\x00l\x00l\x00o\x00\x00\x00\xff\xfew\x00o\x00r\x00l\x00d\x00' ^ ^ </code></pre> <p>在分隔符前面有一个额外的<code>'\x00'</code>,由于字母“0”,它无法正常工作。在</p> <p>有谁能帮我正确解码这两种情况的“数据”吗?在</p> <p><b>更新:</b></p> <p>我会尽量把问题简单化。 s1=编码(utf-8/utf-16)字符串</p> <p>s2=二进制字符串(非unicode)</p> <p>utf-16的分隔符是<code>'\x00'+'\x00'</code>,utf-8的分隔符是<code>'\x00'</code></p> <p>数据=(s1+分隔符)+s2</p> <p>有人能帮我从“数据”中提取s1和s2吗?在</p> <p>更新2:解决方案</p> <p>下面的代码符合我的要求</p> <pre><code>def splitNullTerminatedEncStrings(self, data, encoding_type, no_of_splits): data_dec = data.decode(encoding_type, 'ignore') chunks = data_dec.split('\x00', no_of_splits) enc_str_lst = [] for data_dec_seg in chunks[:-1]: enc_str_lst.<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>(data_dec_seg.encode(encoding_type)) data_dec_chunks = '\x00'.join(chunks[:-1]) if(data_dec_chunks): data_dec_chunks += '\x00' data_chunks = data_dec_chunks.encode(encoding_type) data_chunks_len = len(data_chunks) enc_str_lst.append(data[data_chunks_len:]) # last segment return enc_str_lst </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你为什么不先解码这些字符串呢?在</p> <p>Python 2:</p> <pre><code>decoded = unicode(data, 'utf-8') # or decoded = unicode(data, 'utf-16') </code></pre> <p>Python 3:</p> ^{pr2}$ <p>然后直接对不可知的数据进行编码,定界符总是一个空值。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
7 回答
为什么在使用strptim时会出现这个datetime日期错误
10 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
3 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
3 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
4 回答
为什么在使用tabla时会得到一个空的数据帧?
9 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
8 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
10 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
6 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
8 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
9 回答
为什么在使用TextBlob时会出现HTTP错误?
10 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
1 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
9 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
3 回答
为什么在使用tkinter时不能使用复选框?
6 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
6 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
8 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
6 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
2 回答