回归不连续性的Pythonic包
py-rdpackages的Python项目详细描述
Python的最新研发包
安装
请注意,安装时应混合使用pip和R中的直接安装,以便安装正确版本的软件包。在
使用pip for python:
pip install py_rdpackages
重要提示:您需要在R中安装原始的rdrobust
:
install.packages('rdrobust')
注意事项:
rdrobust
需要ggplot2
的最新版本,所以请:install.packages('ggplot2')
- Anaconda中的
rdrobust
和ggplot2
版本落后于R的当前版本。请直接在R中安装,而不是通过conda安装。在
介绍和使用
这些包是一个正在进行的工作,但是它们试图创建一个包装器来实现这里的奇妙的RD包(https://sites.google.com/site/rdpackages/rdrobust),这些包利用R或Stata,以便可以直接在Python中使用。在
我利用Seaborn的图形包使绘图看起来很漂亮,并启用其他功能,例如按大小划分的点。在
py_rdpackages
中有三个包:
rdplot
创建带有各种选项的回归不连续图。在rdrobust
进行RD并报告回归结果。在rdbwselect
选择最佳带宽大小。在
输出示例
testing文件夹中的代码生成以下示例。在
要求和稳定性
使用这些程序需要以下所有Python包:
rpy2
在Python中运行Rmatplotlib
和{},用于生成高质量的图形 pandas
,numpy
,用于数据操作和数据帧读取
目前测试和稳定:
rdrobust
版本0.99.9rpy2
版本2.9.4(通过conda更新的最新版本——可能适用于以后的版本)ggplot2
版本3.3.0
局限性
ryp2
产生了缓慢的pandas DF到R DF的转换,因此我使用pd.df.to_csv('temp_file_for_rd.csv')
作为解决方案,然后在完成分析后删除相同的文件。这应该在以后的版本中修复。在- 当然,Python调用R然后再转换回Python并不理想。一些未来的版本应该从头开始编码。在
- 项目
标签: