一个用于抓取的python包kenpom.com网站NCAA篮球数据。
kenpomp的Python项目详细描述
Kenponpy-书呆子的篮球
在
这个python包作为kenpom.com的一个方便的web scraper,它提供了大量的NCAA篮球统计数据和指标。它需要订阅Ken Pomeroy的站点才能使用,否则只能访问主页。这是一年的访问费,在我看来完全值得。在
目的
最终,这个软件包允许业余爱好者和知名的体育分析师以更适合可视化、转换和附加分析的格式从kenpom获取数据。它的目的是简单,易于使用,并以一种立即可用的方式生成信息。在
负责任的使用
与许多web scraper一样,以合理的方式使用这个包的责任落在用户身上。不要像个混蛋一样,一分钟内不断地浏览网站上千次,否则你就有被禁止访问的风险,这是你应得的。我对你如何使用(或滥用)这个软件包不负任何责任。理智点。在
但我用R
是的,是的,但是你听说过reticulate吗?它是python的R接口,也支持传递对象(比如dataframes!)他们之间。在
安装
kenpompy
可通过pip
轻松安装:
pip install kenpompy
它能(和不能)做什么
这是一个正在进行的工作-它目前可以抓取所有的摘要、FanMatch和杂项表,几乎所有这些都在Stats和Miscellany标题下。Team
和{
使用
kenpompy
使用简单。通常,每一页上的表都被刮入pandas
个数据帧中,这些数据框有简单的参数来选择不同的季节或表格。由于许多表的头文件不能很好地解析,有些表被手动修改到很小的程度,以使生成的数据帧更易于解释和操作。在
首先,您必须登录:
^{pr2}$然后您可以请求将解析为方便的数据帧的特定页面:
import kenpompy.summary as kp
# Returns a pandas dataframe containing the efficiency and tempo stats for the current season (https://kenpom.com/summary.php).
eff_stats = kp.get_efficiency(browser)
贡献
您可以通过创建issues来突出显示bug并为其他特性提供建议。Pull requests也很受欢迎。在
许可证
kenpompy
是在GNU GPLv3.0许可证上发布的。您可以自由使用、修改或以几乎任何方式重新发布它,只要您声明对代码的更改、公开源代码并使用相同的许可证。无论出于何种目的,它都是免费的,我对它的使用不负任何责任。Read the full license了解更多详细信息。在
- 项目
标签: