擅长:python、mysql、java
<p>你说:</p>
<blockquote>
<p>Still I will need assistance to eliminate the list altogether but return just a string. like this</p>
</blockquote>
<p>换句话说,你有<code>foo = [some_string]</code>,你正在做<code>print foo</code>,作为一个边,<code>repr(some_string)</code>但是你不想用方括号括起来。所以只要做<code>print repr(foo[0])</code>。</p>
<p>似乎有几件事无法解释:</p>
<ol>
<li><p>您说有用的文本用<code>\xaaU</code>括起来,但是在示例文件中,在开头附近只有<code>\xaa</code>(缺少<code>U</code>),而没有其他内容。</p></li>
<li><p>你说呢</p>
<blockquote>
<p>I have found out that re.findall(r'.+', line1) strips to ...</p>
</blockquote>
<p>实际上是剥离<code>\n</code>(但不是<code>\r</code>!!)我认为在尝试恢复电子邮件时,换行是值得保留的。</p>
<pre><code>>>> re.findall(r'.+', 'abc\r\ndef\r\n\r\n')
['abc\r', 'def\r', '\r']
</code></pre>
<p>你对<code>\r</code>字符做了什么?你测试过多行信息吗?你测试过多消息文件吗?</p></li>
<li><p>一个人可以猜测谁或什么人打算消耗你的输出;你写</p>
<blockquote>
<p>I need to parse the text line by line and word by word</p>
</blockquote>
<p>但你似乎过于关心用<code>\xab</code>而不是乱七八糟地打印消息。</p></li>
<li><p>最新代码中的最后6行左右(<code>for msgline in msglines:</code>等)应该缩进一级。</p></li>
</ol>
<p>有没有可能澄清以上所有的问题?</p>