Selenium Webdriver:如何用Python下载PDF文件?

2024-10-16 09:10:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用SeleniumWebDriver自动下载几个PDF文件。我得到了PDF预览窗口(见下文),现在我想下载文件。如何使用Google Chrome作为浏览器来实现这一点?

Dialog Box


Tags: 文件pdfgoogle浏览器chromeseleniumwebdriver见下文
2条回答

试试这个代码,对我有用。

options = webdriver.ChromeOptions()
options.add_experimental_option('prefs', {
"download.default_directory": "C:/Users/XXXX/Desktop", #Change default directory for downloads
"download.prompt_for_download": False, #To auto download the file
"download.directory_upgrade": True,
"plugins.always_open_pdf_externally": True #It will not show PDF directly in chrome
})
self.driver = webdriver.Chrome(options=options

您可以使用selenium从web下载pdf(Embeded pdf&;Normal pdf)。

from selenium import webdriver

download_dir = "C:\\Users\\omprakashpk\\Documents" # for linux/*nix, download_dir="/usr/Public"
options = webdriver.ChromeOptions()

profile = {"plugins.plugins_list": [{"enabled": False, "name": "Chrome PDF Viewer"}], # Disable Chrome's PDF Viewer
               "download.default_directory": download_dir , "download.extensions_to_open": "applications/pdf"}
options.add_experimental_option("prefs", profile)
driver = webdriver.Chrome('C:\\chromedriver\\chromedriver_2_32.exe', chrome_options=options)  # Optional argument, if not specified will search path.

driver.get(`pdf_url`)

它将下载pdf并保存在指定的目录中。根据您的方便更改download_dir位置和chrome driver location

您可以从here下载chrome驱动程序。

希望有帮助!

相关问题 更多 >