擅长:python、mysql、java
<p>你没那么远!在</p>
<p>首先,确保导入正确版本的BeautifulSoup4,方法是执行<code>apt-get install python3-bs4</code>(假设您使用的是Ubuntu或Debian并运行python3)。在</p>
<p>然后隔离html <code>table</code>的<code>td</code>元素并稍微清理数据。例如,删除列表中无用的前3个元素,并删除丑陋的'\n':</p>
<pre><code>import urllib
from bs4 import BeautifulSoup
url = "http://www2.bmf.com.br/pages/portal/bmfbovespa/lumis/lum-taxas-referenciais-bmf-enUS.asp?Data=11/22/2017&Data1=20171122&slcTaxa=APR#"
soup = BeautifulSoup(urllib.request.urlopen(url).read(),'lxml')
rows=list()
for tr in soup.findAll('table'):
for td in tr:
rows.append(td.string)
temp_list=rows[3:]
final_list=[element for element in temp_list if element != '\n']
</code></pre>
<p>我不知道你想精确提取哪些数据。现在您需要处理Python列表(这里称为<code>final_list</code>)!在</p>
<p>希望一切都清楚。在</p>