<p>我一直在为HTML编写一些RegEx代码。我使用美丽的雾部分,并需要一些正则表达式的一些部分。在</p>
<p>代码如下:</p>
<pre><code>`import urllib.request
from bs4 import BeautifulSoup
import re
lll=''
f=open('n.txt','w')
u='http://fortune.com/2015/12/31/wall-street-boutiques-did-well/'
r=urllib.request.urlopen(u)
s=BeautifulSoup(r.read(),'html.parser')
x=s.findAll('p')
print(r.read())
for p in x:
l=str(p)
ll=re.findall('<p>(.*)<a .*>',l)
for t in ll:
l1=t
ln=re.findall('<a .*>(.*)</a>',l)
for t in ln:
l2=t
lnn=re.findall('</a>(.*)</p>',l)
for t in ll:
l3=t
lll= str(lll)+str(ll)+str(l2)+str(l3)`
</code></pre>
<p>但我得到了这个,为什么?在</p>
^{pr2}$