一个python脚本,用于将网页提交给wayback机器进行存档。
wayback-machine-archiver的Python项目详细描述
Wayback machine archiver(简称archiver)是一种命令行实用程序 用python编写以使用Internet Archive备份github页面。
安装
安装archiver的最佳方法是使用pip:
pip install wayback-machine-archiver
这将使您只需调用:
archiver --help
您还可以克隆此存储库:
git clone https://github.com/agude/wayback-machine-archiver.git
cd wayback-machine-archiver
python ./wayback_machine_archiver/archiver.py --help
如果克隆存储库,则可以将archiver安装为本地 使用setup.py脚本的应用程序:
git clone https://github.com/agude/wayback-machine-archiver.git
cd wayback-machine-archiver
./setup.py install
它与使用pip一样,通过调用 archiver。
用法
您可以通过指定网页的url来安排备份,如下所示:
archiver https://alexgude.com
这将提交我博客的主页, alexgude.com,返回到 存档。
您还可以将 `sitemap.xml<;https://en.wikipedia.org/wiki/Sitemaps>;``如下:
archiver --sitemaps https://alexgude.com/sitemap.xml
这将备份我网站的站点地图中列出的每个页面, alexgude.com。
您可以通过指定多个URL或站点地图来备份多个页面:
archiver https://radiokeysmusic.com --sitemaps https://charles.uno/sitemap.xml https://alexgude.com/sitemaps.xml
站点地图通常不包括它们自己,因此您可以请求站点地图 使用标志--archive-sitemap-also备份自身:
archiver --sitemaps https://alexgude.com/sitemaps.xml --archive-sitemap-also
archiver需要的“请求” Kenneth Reitz的图书馆。 Archiver支持Python2.7和Python3.4+。
为github页面设置Sitemap.xml。
很容易为github页面jekyll自动生成站点地图 地点。简单使用 jekyll/jekyll-sitemap。
安装说明可以在上面的站点上找到;它们需要更改 只是你网站_config.yml中的一行。