用于提取Maven坐标的爬虫
mvncrawler的Python项目详细描述
小牛爬虫
这是一个爬行Maven存储库和收集Maven坐标的工具。 它可以用于研究和教育目的。在
安装
要求
- Python 3.5或更高版本
- Apache Kafka(可选)
快速安装
pip install mvncrawler
使用
^{pr2}$它提取10个Maven坐标。在
- 使用
--help
选项查看每个参数的描述。在 - 如果您的机器上没有Kafka服务器,请在工具中添加
--no-kafka
选项,以便将Maven坐标保存在文件中。在 - 您可以删除
--l 10
选项来提取Maven坐标而不受限制。在
输出格式
提取的Maven坐标转换为JSON兼容字符串,如下所示:
{"groupId": "com.yahoo.vespa", "artifactId": "zookeeper-server-common", "version": "7.171.10", "date": "1580860140", "url": "https://repo1.maven.org/maven2/com/yahoo/vespa/zookeeper-server-common/7.171.10/zookeeper-server-common-7.171.10.pom"}
groupId
:POM文件中指定的groupID。在artifactId
:POM文件中指定的artifactID。在version
:Maven包在其POM文件中指定的版本。在date
:Unix epoch格式的Maven包的发布日期。在url
:Maven服务器上POM文件的URL。在
免责声明
我们对任何损坏或误用此工具概不负责。在
- 项目
标签: