用于经验数据操作的python项目。

empiricalutilities的Python项目详细描述


PyPI-StatusPyPI-VersionsLICENSE

empiricalutilities是一个用于操作数据帧的经验包,
特别是那些具有日期时间索引和其他公共数据科学功能的 重点是改善结果的可视化。

Installation

Latest PyPI stable release

PyPI-Status

pip install empiricalutilities

Latest development release on GitHub

GitHub-StatusGitHub-StarsGitHub-CommitsGitHub-Forks

拉入并安装到当前目录:

pip install -e git+https://github.com/jason-r-becker/empiricalutilities.git@master#egg=empiricalutilities
importempiricalutilitiesaseueu.latex_print(np.arange(1,10))...

Usage

empiricalutilities非常通用,可以用多种方式使用。 在数据帧中可视化数据并导出到乳胶的一些示例如下 提供如下。

importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportempiricalutilitiesaseu

Data Visulization

生成随机数据帧后,可以使用color_table()。 观察行或列之间比较的相对值。获取数据集 这可能是足球运动员在不同的未命名训练中的得分:

np.random.seed(8675309)cols=['QB #1001','RB #9458','WR #7694','QB #5463','WR #7584','QB #7428']table=pd.DataFrame(np.random.randn(5,6),columns=cols)color_table(table,axis=0)plt.show()

Screenshot-color_table

Simple Export to LaTeX

使用latex_print()

eu.latex_print(table)

Screenshot-latex_print_simple_code

可以复制并粘贴到乳胶中:

Screenshot-latex_print_simple

Table with Standard Errors

现在,让我们假设球员们已经进行了多次训练,所以我们 平均分和标准差。我们可以把平均值和 它们各自的错误只有一行使用combine_errors_table()。 此外,我们可以将结果打印到屏幕上,这样就很容易 使用prettyPrint()

解释
errors=pd.DataFrame(np.random.randn(5,6),columns=cols)/10error_table=combine_errors_table(table,errors,prec=3)eu.prettyPrint(error_table)

Screenshot-prettyprint

Advanced Export to LaTeX

要导出此表,我们必须首先创建带有 参数latex_format=Truecombine_errors_table()知道它 需要用乳胶格式打印。

error_table=combine_errors_table(table,errors,prec=3,latex_format=True)

我们还可以探索latex_print()中提供的一些高级选项。 首先,表头可以分成两行,这是通过 参数multi_row_header=True。当为true时,latex_print()需要 带有列标题的数据帧,包含一个'*',用于标记每个 新的一排。我们将使用列表理解创建一个新的列标题列表,其中 空格被' * '替换,导致顶部标题行为 玩家位置和底部是玩家编号。

multi_cols=[col.replace(' ',' * ')forcolincols]error_table.columns=multi_cols

接下来,我们可以对标题进行排序。假设我们想按位置分组,然后 最感兴趣的是四分卫,尤其是那些人数众多的四分卫。 custom_sort()可用于创建我们自己的排序规则。通过设置 将字母表排序到'QWR9876543210',我们首先选择位置qb->;wr->;rb, 从9开始按降序排列第二。

sort_alphabet='QWR9876543210'sorted_cols=eu.custom_sort(multi_cols,sort_alphabet)

另外,我们可以通过加粗来增加表的表达能力 每次训练的最佳表现。find_max_locs()标识 数据框中每行最大值的位置。我们必须小心分类 原始表与具有标准错误的表相同 页眉列的个数被更改。

table.columns=multi_colsmax_locs=eu.find_max_locs(table[sorted_cols])

最后,添加标题可以使用caption参数完成,并且 可以使用hide_index=True删除非格式化索引。对于宽桌子, 添加adjust=True会自动将表大小调整为 您的乳胶环境,根据需要调整文本大小。

eu.latex_print(error_table[sorted_cols],caption='Advanced example of printing to LaTeX.',adjust=True,multi_row_header=True,hide_index=True,bold_locs=max_locs,)

Screenshot-latex_print_advanced

Contributions

GitHub-CommitsGitHub-IssuesGitHub-PRs

所有源代码都托管在GitHub上。 欢迎捐款。

LICENSE

开源(OSI批准):LICENSE

Authors

主要开发人员:

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
无法在Netbeans 8.2 JDK8u231中创建java Maven项目(Web应用程序)   java如何以设定的时间间隔生成随机数?   java从socket和inputStream的慢速读取   spring SCORM:Java中基于Web的SCORM播放器   Java将函数传递给方法   java绑定通用服务及其实现和子类型   java如何在运行时从选择列表框中动态选择选项?爪哇硒   java Selenium WebDriver什么是“Selenium客户端和WebDriver语言绑定”   elasticsearch需要elasticsearch高级Java客户端更新ByQueryRequest API帮助   JAVA哈希表查找最大值   WSDL操作中的java soapAction属性为空   java访问封闭类或父类方法的一般方法   eclipse在java中运行带有SeleneTestCase的ANT。lang.NoClassDefFoundError   java Hazelcast不会在节点启动时填充ReplicatedMap   如何在Java中从excel中读取特定行?   html JAVA将本地时间(GMT+8)转换为UTC时间   java将自定义端点添加到Spring数据REST存储库中,并以大摇大摆的方式显示   java计算未来位置