擅长:python、mysql、java
<p>问:如何读取文件?二进制和文本穿插在一起</strong></p>
<p><em>A:不用麻烦,只要把它当作普通文本来读,你就可以保持你的二进制/文本二分法(否则你就不能很容易地对它进行正则表达式)</em></p>
<pre><code>fh = open('/path/to/my/file.ext', 'r')
fh.read()
</code></pre>
<p>如果以后出于某种原因想读取二进制文件,只需在open的第二个输入中添加一个b:</p>
^{pr2}$
<p><strong>Q:消除不必要的控制字符</strong></p>
<p><em>A:使用python<a href="http://docs.python.org/library/re.html" rel="nofollow">re</a>模块。你的下一个问题是如何</em></p>
<p><strong>Q:解析两个\xaa有用文本信息之间的消息\xaa(HEX'aa')</strong></p>
<p><em>A:re模块有一个findall函数,它的工作方式与您(大多数)期望的一样。</em></p>
<pre><code>import re
mytext = '\xaaUseful text that I want to keep\xaa^X^X^X\xaaOther text i like\xaa'
usefultext = re.findall('\xaa([a-zA-Z^!-~0-9 ]+)\xaa', mytext)
</code></pre>
<p><strong>Q:打印出所需资料</strong></p>
<p>*A:有一个打印功能。。。</p>
<pre><code>print usefultext
</code></pre>
<p><strong>Q:把所有的线都圈起来。。以及更多文件。</strong></p>
<pre><code>fh = open('/some/file.ext','r')
for lines in fh.readlines():
#do stuff
</code></pre>
<p>我将让您找出<a href="http://docs.python.org/library/os.html" rel="nofollow">os</a>模块来确定存在哪些文件/如何遍历它们。</p>