一个python脚本,用于将网页提交给wayback机器进行存档。

wayback-machine-archiver的Python项目详细描述


Wayback machine archiver(简称archiver)是一种命令行实用程序 用python编写以使用Internet Archive备份github页面。

安装

安装archiver的最佳方法是使用pip

pip install wayback-machine-archiver

这将使您只需调用:

archiver --help

您还可以克隆此存储库:

git clone https://github.com/agude/wayback-machine-archiver.git
cd wayback-machine-archiver
python ./wayback_machine_archiver/archiver.py --help

如果克隆存储库,则可以将archiver安装为本地 使用setup.py脚本的应用程序:

git clone https://github.com/agude/wayback-machine-archiver.git
cd wayback-machine-archiver
./setup.py install

它与使用pip一样,通过调用 archiver

用法

您可以通过指定网页的url来安排备份,如下所示:

archiver https://alexgude.com

这将提交我博客的主页, alexgude.com,返回到 存档。

您还可以将 `sitemap.xml<;https://en.wikipedia.org/wiki/Sitemaps>;``如下:

archiver --sitemaps https://alexgude.com/sitemap.xml

这将备份我网站的站点地图中列出的每个页面, alexgude.com

您可以通过指定多个URL或站点地图来备份多个页面:

archiver https://radiokeysmusic.com --sitemaps https://charles.uno/sitemap.xml https://alexgude.com/sitemaps.xml

站点地图通常不包括它们自己,因此您可以请求站点地图 使用标志--archive-sitemap-also备份自身:

archiver --sitemaps https://alexgude.com/sitemaps.xml --archive-sitemap-also

archiver需要的“请求” Kenneth Reitz的图书馆。 Archiver支持Python2.7和Python3.4+。

为github页面设置Sitemap.xml

很容易为github页面jekyll自动生成站点地图 地点。简单使用 jekyll/jekyll-sitemap

安装说明可以在上面的站点上找到;它们需要更改 只是你网站_config.yml中的一行。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java什么是VMObject?   java将数据插入H2数据库表   java如何修改保存在一个卡夫卡主题中的Twitter API消息并将其发送到另一个卡夫卡主题   对象Java变量别名解决方法   java返回数组在try/catch中初始化   java DateTimeFormat shortDate无年份   java我如何在recycle应用程序的首次发布中突出显示项目   java使文本区域包含大量文本,其帧响应更快   类抛出的java ClassCircularyError。forName在转换TwoStacksPlainDatagramSocketImpl类时   swing如何在GroupLayout Java中设置Jframe背景图像   sip无法在独立java应用程序上运行PJSIPJNI包装   java Android internet连接问题   java当单击按钮VerEstoque时,应用程序停止。代码上有Logcat错误,请输入h3lp   java如何在JFrame上设置图像图标动画图像将加载但不会更改   与socket一起使用时,java错误的currentTimeMillis()   Java内部字符串表示:是UTF16吗?