如何只下载新文件？

for link in soup.select("a[href$='v2.pdf']"): filename = os.path.join(folder_location,link['href'].split('/')[-1]) with open(filename, 'wb') as f: f.write(requests.get(urljoin(url,link['href'])).content)

1条回答

网友

1楼 · 发布于 2024-05-18 15:33:14

从这个问题How do I list all files of a directory?您可以使用此代码列出所有当前文件和目录

from os import listdir
from os.path import isfile, join
mypath = './'
files = [f for f in listdir(mypath) if isfile(join(mypath, f))]

在列表中获得每个文件后，您可以在下载每个文件时检查每个文件

for link in soup.select("a[href$='v2.pdf']"):
    filename = os.path.join(folder_location,link['href'].split('/')[-1])
    if (not filename in files):
        with open(filename, 'wb') as f:
            f.write(requests.get(urljoin(url,link['href'])).content)

编程相关推荐

未检测到“空格”的java ASCII码
音频如何在Java中设置SourceDataLine的音量
java MyBatissSpringBoot无法使用作为bean注入的数据源
Java字谜递归列表<List<String>>仅存储空列表<Strings>
java显示30px高的JPanel，然后用minecraft填充剩余空间
java JOGL平滑度
Java：按完整与否对1d对象数组进行排序
arraylist仅当java结构不存在时才将对象添加到java结构中
无法初始化java渲染库在安卓 studio 4.1.1上出现错误
java SpringBoot ClassCastException

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何只下载新文件？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >