下载从网页链接的所有文档。

downlink的Python项目详细描述


下行

A python library and command line tool for scraping (and downloading) links on a web page.

linkscraper.py
LinkScraper - class for scraping links from a page
document_linkscraper.py
DocumentLinkScraper - subclass of LinkScraper
  • class for scraping “document links,” which all end in a given file extension, such as “.pdf”
__init__.py
imports library classes for cleaner importing
主要的
main()-命令行工具的入口点

命令行工具

Basic usage:

$ downlink “https://www.ct.gov/doh/cwp/view.asp?a=4513&q=530462” output

The above will download all PDF documents to a folder called “output” which must exist and be writable.

To download files of a different extension, use the –ext option.

For more usage details, run downlink –help

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在glassfish3服务器上上载应用程序文件(ords.war)时发生java部署错误   java如何更改Elasticsearch上的别名值?   java如何使用Xpath读取更多XSD模式?   java使用jstl在两个jsp之间访问值   java将控制台输出转换为PDF文件   java在循环后没有得到任何结果,几乎完成   java运行的程序无法适应变化   java 安卓 RecyclerView添加新项目将回收移至列表顶部   将字符串转换为日期时的java偏移量   导入包的java问题   java gl。glScalef()隐藏gl。glDrawArrays()绘图   java在读取URL时没有协议异常   javascript Nashorn错误与某些函数有关