数据科学:定量和定性变量之间的相关性(python语言)

2024-05-21 06:56:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道是否可以用python来衡量一个定量变量(在我的例子中是家庭的平均每日消费量)和一个定性变量(在我的例子中是月份:1,2,…,12)之间的相关性?在

每月平均每日消耗量
------------------------------------------
1 | 12.1183658615616
2 | 11.713968603585668
3 | 11.902829015188159
4 | 10.12066900094302
5 | 8.879703717271864
6 | 8.384419625257689
7 | 8.14645359363365
8 | 7.961394876525876
9 | 8.748848024841289
10 | 9.820944144869841
11 | 11.247017177860053
12 | 12.069888731716086

谢谢。在


Tags: 家庭例子定性定量月份消耗量消费量
1条回答
网友
1楼 · 发布于 2024-05-21 06:56:31

我们可以使用numpymatplotlib库来显示是否存在相关性。在

以下内容是在Jupyter笔记本中编写的,但应该在Python中删除注释为“remove”的行

import numpy as np

#x values
x = [1,2,3,4,5,6,7,8,9,10,11,12]

# y values 
y = [12.11836586156116, 11.713968603585668, 11.902829015188159, 10.12066900094302, 8.879703717271864, 8.384419625257689, 8.146453593663365, 7.961394876525876, 8.748848024841289, 9.820944144869841, 11.247017177860053 , 12.069888731716086]

print( np.corrcoef(x, y))

该输出: [[1。-0.22316588] [-0.22316588 1。]] 显示出一个小的负相关。在

然后我们可以绘制x,y值:

^{pr2}$

这给了我们以下的线索:月份和月消费之间没有直接的相关性。在

A put of x and y values

这看起来可能是一种周期性消费。假设1-12月是几个月,那么消费量从年中到年底上升,然后下降到年中,然后又上升。如果是这样的话,她会把过去几年的数据加起来。在

相关问题 更多 >