擅长:python、mysql、java
<p>您可以使用优秀的<a href="http://docs.python-requests.org/en/master/" rel="nofollow noreferrer">^{<cd1>}</a>库,如下所示:</p>
<pre><code>import bs4
import requests
url = "https://physionet.org/physiobank/database/shareedb/"
html = requests.get(url)
soup = bs4.BeautifulSoup(html.text, "html.parser")
for link in soup.find_all('a', href=True):
href = link['href']
if any(href.endswith(x) for x in ['.dat','.hea','.qrs']):
print "Downloading '{}'".format(href)
remote_file = requests.get(url + href)
with open(href, 'wb') as f:
for chunk in remote_file.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
</code></pre>
<p>这将把所有<code>.dat</code>、<code>.hea</code>和<code>.qrs</code>文件下载到您的计算机上。在</p>
<p>使用标准安装:</p>
^{pr2}$
<p>注意,该URL上的所有href格式都适合直接用作文件名(因此目前不需要解析任何<code>/</code>字符)。在</p>