madlib的python包装器(http://madlib.net)-一个用于可伸缩的数据库机器学习算法的开源库
pymadlib的Python项目详细描述
现阶段实现线性回归、逻辑回归、支持向量机(回归与分类)。madlib的k均值和lda算法。
madlib的用户文档参见:http://doc.madlib.net/v0.5/madlib的用户文档。
========================================================
依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖=
需要python扩展名:psycopg2才能使用pymadlib。
(i)如果有matplotlib安装后,您将看到线性回归演示的matplotlib可视化。
(ii)如果您安装了networkx(http://networkx.github.com/download.html)。您将看到k-means演示的可视化
(iii)pyroc(https://github.com/marcelcaraciolo/pyroc)包含在该发行版的源代码中,并得到其开发人员的许可。您将看到逻辑回归的roc曲线的可视化。
用法:
-----------------------------
[数据库连接]
用户=gpadmin
密码=xxxxx
主机名=127.0.0.1(或数据库服务器的IP)
端口=5432(数据库的端口)
数据库=vatsand(要连接的数据库to)安装说明:
使用easy_install或pip,只需运行:
sudo easy_install pymadlib
然后只需从pymadlib运行
python-c。示例导入rundemos;rundemos()'
与此安装一起打包的数据集:
===========br/>pymadlib从UCI机器学习库和其他来源打包公共可用的数据集。
1)来自UCI机器的葡萄酒质量数据集学习资源库:http://archive.ics.uci.edu/ml/datasets/wine+quality
2)uci-ml资源库中的自动mpg数据集:http://archive.ics.uci.edu/ml/datasets/auto+mpg
3)奥巴马-罗姆尼第二次总统辩论(2012)lda模型的成绩单。
如果您使用的是MacOSX10.6.x,那么在安装psycopg2时可能会遇到一些问题。
以下是一些讨论此问题并提供解决方案的博客:
http://hardlifeofapo.com/psycopg2-and-postgresql-9-1-on-snow-leopard/
http://www.initd.org/psycopg/articles/2010/11/links-about-building-psycopg-mac-os-x/
madlib的用户文档参见:http://doc.madlib.net/v0.5/madlib的用户文档。
========================================================
依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖依赖=
需要python扩展名:psycopg2才能使用pymadlib。
(i)如果有matplotlib安装后,您将看到线性回归演示的matplotlib可视化。
(ii)如果您安装了networkx(http://networkx.github.com/download.html)。您将看到k-means演示的可视化
(iii)pyroc(https://github.com/marcelcaraciolo/pyroc)包含在该发行版的源代码中,并得到其开发人员的许可。您将看到逻辑回归的roc曲线的可视化。
用法:
-----------------------------
[数据库连接]
用户=gpadmin
密码=xxxxx
主机名=127.0.0.1(或数据库服务器的IP)
端口=5432(数据库的端口)
数据库=vatsand(要连接的数据库to)安装说明:
使用easy_install或pip,只需运行:
sudo easy_install pymadlib
然后只需从pymadlib运行
python-c。示例导入rundemos;rundemos()'
与此安装一起打包的数据集:
===========br/>pymadlib从UCI机器学习库和其他来源打包公共可用的数据集。
1)来自UCI机器的葡萄酒质量数据集学习资源库:http://archive.ics.uci.edu/ml/datasets/wine+quality
2)uci-ml资源库中的自动mpg数据集:http://archive.ics.uci.edu/ml/datasets/auto+mpg
3)奥巴马-罗姆尼第二次总统辩论(2012)lda模型的成绩单。
如果您使用的是MacOSX10.6.x,那么在安装psycopg2时可能会遇到一些问题。
以下是一些讨论此问题并提供解决方案的博客:
http://hardlifeofapo.com/psycopg2-and-postgresql-9-1-on-snow-leopard/
http://www.initd.org/psycopg/articles/2010/11/links-about-building-psycopg-mac-os-x/