我正在为我的学校项目做一个大数据项目。我的数据集如下所示: https://github.com/gindeleo/climate/blob/master/GlobalTemperatures.csv
我在试着预测“陆地平均温度”的下一个数值。你知道吗
首先,我将csv导入到pandas中,并使其成为名为“df1”的数据帧。你知道吗
在sklearn的第一次尝试中出错后,我将“dt”列从string转换为datetime64,然后添加了一个名为“year”的列,它只显示日期值中的年份。-这可能是错误的-
df1["year"] = pd.DatetimeIndex(df1['dt']).year
在这一切之后,我准备好了我的数据进行reggression并调用了RandomForestReggressor:
landAvg = df1[["LandAverageTemperature"]]
year = df1[["year"]]
from sklearn.ensemble import RandomForestRegressor
rf_reg=RandomForestRegressor(n_estimators=10,random_state=0)
rf_reg.fit(year,landAvg.values.ravel())
print("Random forest:",rf_reg.predict(landAvg))
我运行了代码,看到了这个结果:
Random forest: [9.26558115 9.26558115 9.26558115 ... 9.26558115 9.26558115 9.26558115]
我没有得到任何错误,但我不认为结果是正确的-结果都是一样的,你可以看到-。另外,当我想得到下一个10年的预测时,我不知道该怎么做。用这个代码我只得到一个结果。你能帮我改进代码并得到正确的结果吗? 事先谢谢你的帮助。你知道吗
仅仅用一年来预测气温是不够的。你也需要使用月份数据。以下是初学者的工作示例:
这里是输出:
相关问题 更多 >
编程相关推荐