我遇到了一个问题,我的scikit学习回归森林几乎立即(在几秒钟内;我从使用这台机器的经验中知道,对于我正在处理的数据集,它应该需要大约半个小时或更长的时间),然后为每一行输入数据预测完全相同的输出。在
我目前的理论是,它与目标变量的量级有关,大约是10^11。我试着用10万乘以10万,看看到底发生了什么,它开始永远运行,直到我把脚本弄死才做任何事情。在
代码如下:
n_estimators = 200
rfr = RandomForestRegressor(n_estimators=n_estimators, verbose = 2, n_jobs = -1)
y_train = df_train[target].values*100000
rfr.fit(X_train, y_train)
rfr.predict(X_train)
你可能会想知道为什么我在训练数据上运行它-我只是想测试它是否真的在做什么,其实它没有
谢谢你的帮助!在
编辑:
这是目标数据的describe()输出。训练数据的大小基本相似:
^{pr2}$我尝试标准化数据并运行林;它没有输出,但内存使用量不断攀升,所以它一定在做些什么。回归森林需要很高的计算机能力吗?我用的是一台带有i7处理器和OK显卡的笔记本电脑;我可以很好地分类。在
目前没有回答
相关问题 更多 >
编程相关推荐