vtret是一个pandas.dataframe处理器/调节器,它以统计上合理的方式为预测建模准备真实的数据。

vtreat的Python项目详细描述


This是python版本的vtreat数据准备系统 (也可用作^{} package)。

vtreat是一个DataFrame处理器/调节器,用于准备 用于有监督机器学习或预测建模的真实数据 以统计上合理的方式。

vtreat接受输入DataFrame 具有名为“结果变量”(或“y”)的指定列的 这是要预测的数量(不能缺少 价值观)。其他输入列是可能的解释变量 (通常是数值或分类/string值,这些列可以 有缺失的值)用户稍后想要用来预测“y”。 在实践中,这样的输入DataFrame可能并不立即适合 对于通常只需要数字的机器学习过程 解释性变量,并且不能容忍丢失的值。

为了解决这个问题,vtreat构建了一个转换的DataFrame,其中 解释性变量列已转换为 数值解释变量列,不缺少值。这个 vtreat实现生成捕获 大多数与解释栏相关的信息 指定的“y”或依赖/结果列 转换(指标变量、影响代码、流行代码和 更多)。这种转化的DataFrame适用于 从线性回归到梯度的有监督学习方法 提升了机器。

这个想法是:你可以获取一个DataFrame混乱的真实世界数据,然后 轻松、忠实、可靠、可重复地为机器准备 使用vtreat的文档化方法学习。合并 vtreat进入机器学习工作流后,您可以快速工作 有非常多样的结构化数据。

可以找到工作示例here

有关详细信息,请参见:arXiv:1611.09477 stat.AP(文档描述了R版本, 然而,所有的例子都可以在Pythonhere中找到。

vtreat可用 作为一个^{}/^{} package, 同时也是一个^{} package

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javaspringbootmockito@injectmock说明如何仅模拟选定的依赖项   尝试在eclipse项目中加载dll时发生java UnsatifiedLinkError   java在文本文件上多次匹配模式?   java如何使用JSON显示天气数据?   java导出内部对象   java获取以链表中特定字符开头的所有元素   swing使主方法等待较小的方法(java)   java如何制作对象的深度副本?   java访问SpringMVC项目中的外部ELEAF文件   java打印没有元素邻接的所有子序列数组   java为什么findLoadedClass方法调用返回不同的结果   java如何在安卓中从sqlite数据库获取单个数据?   java我正在编写一个程序,为twitch流媒体应用程序的eq生成随机竞赛/类   java如何绕过SSL握手javax。网ssl。SSLHandshakeException   java关于LibGdx addListener   线程中的java安卓socket连接