用于提取Maven坐标的爬虫

mvncrawler的Python项目详细描述


小牛爬虫

这是一个爬行Maven存储库和收集Maven坐标的工具。 它可以用于研究和教育目的。在

安装

要求

快速安装

pip install mvncrawler

使用

^{pr2}$

它提取10个Maven坐标。在

  • 使用--help选项查看每个参数的描述。在
  • 如果您的机器上没有Kafka服务器,请在工具中添加--no-kafka选项,以便将Maven坐标保存在文件中。在
  • 您可以删除--l 10选项来提取Maven坐标而不受限制。在

输出格式

提取的Maven坐标转换为JSON兼容字符串,如下所示:

{"groupId": "com.yahoo.vespa", "artifactId": "zookeeper-server-common", "version": "7.171.10", "date": "1580860140", "url": "https://repo1.maven.org/maven2/com/yahoo/vespa/zookeeper-server-common/7.171.10/zookeeper-server-common-7.171.10.pom"}
  • groupId:POM文件中指定的groupID。在
  • artifactId:POM文件中指定的artifactID。在
  • version:Maven包在其POM文件中指定的版本。在
  • date:Unix epoch格式的Maven包的发布日期。在
  • url:Maven服务器上POM文件的URL。在

免责声明

我们对任何损坏或误用此工具概不负责。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JFrame中的Java多线程   java Servlet异常映射   java无法从输出流读取   swing Java带来的小程序GUI问题   java什么原因导致错误“'void'类型此处不允许”以及如何修复它?   Java选择器select(长)与selectNow的区别   java自定义arraylist<mygames>获得不同   java Icepdf注释让页面消失   java反向整数数组   java I在生成同步“无法解析配置的所有依赖项”时遇到此错误:app:debugRuntimeClasspath   多个虚拟机上的java线程访问单个DB实例上的表,有时会导致性能低下和异常   swing更改Java中的默认按钮,使其看起来“更好”   java慢速MQ主题订阅。并行化不能提高性能   java运行Boggle Solver需要一个多小时。我的代码怎么了?   数据库中的java循环与应用程序中的java循环   正则表达式匹配${123…456}并在Java中提取2个数字?   java如何制作我们软件的试用版   Java内存参数计算   从另一个类调用方法时出现java问题