擅长:python、mysql、java
<p>是否要删除<code>html</code>文本中的所有标记?我不会选择正则表达式,最好选择另一种方法,例如使用<code>BeautifulSoup</code>,你会在那次黑客会议上大吃一惊:</p>
<pre><code>from bs4 import BeautifulSoup
myString = "<html><body><p>Hello World!</p><p>Hello Dennis!</p></body></html>"
myList = list(BeautifulSoup(myString).strings))
</code></pre>
<p>它产生:</p>
<pre><code>['Hello World!', 'Hello Dennis!']
</code></pre>