作为我最后一年研究计划的一部分,我试图计算并可视化两个不在有序序列中的变量之间的相关性。在如下数据集中
DateAndTime Demand Temperature
2015-01-02 18:00:00 2081 41
2015-01-02 19:00:00 2370 42
2015-01-02 20:00:00 2048 42
2015-01-02 21:00:00 1806 42
2015-01-02 22:00:00 1818 41
2015-01-02 23:00:00 1918 40
2015-01-03 00:00:00 1685 40
2015-01-03 01:00:00 1263 38
2015-01-03 02:00:00 969 38
2015-01-03 03:00:00 763 37
2015-01-03 04:00:00 622 36
计算和可视化日期和需求之间的相关性很简单,因为它们是有序序列,散点图可以用来轻松地可视化它们的相关性。然而,如果我要计算温度和需求之间的相关性,得到的散点图就没有什么意义了,因为它没有任何数学顺序。应该使用什么方法来以更有意义的方式可视化这两个变量之间的相关性。为此,我使用了基本的python框架,比如Matplotlib、Statsmodels和Sklearn。你知道吗
好的,我们的想法是画两列,一列在x轴,另一列在y轴,试着画一条线来模拟它的行为。Numpy有一个函数来计算
如果我们认为回归线是
y = a*x + b
,你可以得到系数a和b,这样它回来了
用你的x和y
相关问题 更多 >
编程相关推荐