擅长:python、mysql、java
<pre><code>from bs4 import BeautifulSoup, NavigableString, Tag
import requests
import re
r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478')
soup=BeautifulSoup(r.content,'lxml')
tbl=soup.findAll('table')[2]
Contact=tbl.findAll('p')[0]
list=[]
for br in Contact.findAll('br'):
next = br.nextSibling
regex = re.compile(r'[\n\r\t\xa0]')
text=next.strip()
text=regex.sub(' ', next)
list.append(text)
print list
</code></pre>
<p>我仔细研究了一下,发现我可以用正则表达式来计算这些值,但我仍然有一个关于间距的问题
[u'2133 Craigs Store Road',u'Afton,VA 22920',u'联系人:',u'电子邮件地址:',u'网站:',u'电话:434-882-3150',u'']
但至少那些角色已经消失了</p>