一个用于抓取的python包kenpom.com网站NCAA篮球数据。

kenpomp的Python项目详细描述


Kenponpy-书呆子的篮球

Documentation StatusBuild Statuscodecov

这个python包作为kenpom.com的一个方便的web scraper,它提供了大量的NCAA篮球统计数据和指标。它需要订阅Ken Pomeroy的站点才能使用,否则只能访问主页。这是一年的访问费,在我看来完全值得。在

目的

最终,这个软件包允许业余爱好者和知名的体育分析师以更适合可视化、转换和附加分析的格式从kenpom获取数据。它的目的是简单,易于使用,并以一种立即可用的方式生成信息。在

负责任的使用

与许多web scraper一样,以合理的方式使用这个包的责任落在用户身上。不要像个混蛋一样,一分钟内不断地浏览网站上千次,否则你就有被禁止访问的风险,这是你应得的。我对你如何使用(或滥用)这个软件包不负任何责任。理智点。在

但我用R

是的,是的,但是你听说过reticulate吗?它是python的R接口,也支持传递对象(比如dataframes!)他们之间。在


安装

kenpompy可通过pip轻松安装:

pip install kenpompy

它能(和不能)做什么

这是一个正在进行的工作-它目前可以抓取所有的摘要、FanMatch和杂项表,几乎所有这些都在Stats和Miscellany标题下。Team和{}类是计划好的,但它们更复杂,需要一些时间。在

使用

kenpompy使用简单。通常,每一页上的表都被刮入pandas个数据帧中,这些数据框有简单的参数来选择不同的季节或表格。由于许多表的头文件不能很好地解析,有些表被手动修改到很小的程度,以使生成的数据帧更易于解释和操作。在

首先,您必须登录:

^{pr2}$

然后您可以请求将解析为方便的数据帧的特定页面:

import kenpompy.summary as kp

# Returns a pandas dataframe containing the efficiency and tempo stats for the current season (https://kenpom.com/summary.php).
eff_stats = kp.get_efficiency(browser)

贡献

您可以通过创建issues来突出显示bug并为其他特性提供建议。Pull requests也很受欢迎。在

许可证

kenpompy是在GNU GPLv3.0许可证上发布的。您可以自由使用、修改或以几乎任何方式重新发布它,只要您声明对代码的更改、公开源代码并使用相同的许可证。无论出于何种目的,它都是免费的,我对它的使用不负任何责任。Read the full license了解更多详细信息。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
打开OrientDB数据库时发生java错误   java Hibernate合并函数偶尔会导致主键冲突   java如何在SourceTransferndexit将msg放入MQ   JavaEclipse不正确地导入项目   Java中的数据结构,带有删除节点后所有节点的操作   java创建zip存档时,什么构成重复条目   java如何计算所有值并比较每个对象?   java Threadflipbegin在Google Pixel 3上被阻止55秒   java Eclipse Hibernate:未找到适合jdbc的驱动程序:mysql://localhost:3306/hibernatedb   java Quartz计划程序未运行   java如何从junit扩展向@Test返回值?   java忽略搜索字段中的大小写   java如何从图库中选取图像,裁剪并保存在数据分区中   java CST/CDT时区更改问题   url从Java读取Twitter页面   java是否要在每个列表项中打开WebView单击?   比较输入值的Java布尔逻辑初学者   如何在服务器端使用java从客户端的HTTP POST请求接收和解析JSON对象   javascript在一个get请求中,如何启动程序,然后使用另一个get请求停止它?