擅长:python、mysql、java
<p>使用BeautifulGroup模块从<code><p></code>标记提取所有文本。在</p>
<p><strong>内容脚本.py:</strong></p>
<pre><code>from bs4 import BeautifulSoup
import sys
soup = BeautifulSoup(open(sys.argv[1], 'r'), 'html')
print(' '.join(map(lambda e: e.string, soup.find_all('p'))))
</code></pre>
<p>运行方式如下:</p>
^{pr2}$