Sci-kit学习回归随机森林回归器实现

2024-06-29 00:50:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我遇到了一个问题,我的scikit学习回归森林几乎立即(在几秒钟内;我从使用这台机器的经验中知道,对于我正在处理的数据集,它应该需要大约半个小时或更长的时间),然后为每一行输入数据预测完全相同的输出。在

我目前的理论是,它与目标变量的量级有关,大约是10^11。我试着用10万乘以10万,看看到底发生了什么,它开始永远运行,直到我把脚本弄死才做任何事情。在

代码如下:

n_estimators = 200
rfr = RandomForestRegressor(n_estimators=n_estimators, verbose = 2, n_jobs = -1)
y_train = df_train[target].values*100000
rfr.fit(X_train, y_train)

rfr.predict(X_train)

你可能会想知道为什么我在训练数据上运行它-我只是想测试它是否真的在做什么,其实它没有

谢谢你的帮助!在

编辑:

这是目标数据的describe()输出。训练数据的大小基本相似:

^{pr2}$

我尝试标准化数据并运行林;它没有输出,但内存使用量不断攀升,所以它一定在做些什么。回归森林需要很高的计算机能力吗?我用的是一台带有i7处理器和OK显卡的笔记本电脑;我可以很好地分类。在


Tags: 数据脚本机器目标森林时间train经验