<p>我认为这个数据是线性的,因为人们会随着年龄的增长而结婚。所以,它可以用线性方程来表示。
基本上可以用机器学习的线性回归模型来求解。
我想你在做某种机器学习模型。
不管怎样,这是一个样本代码,我计算了每个婚姻状况的平均值。你知道吗</p>
<pre><code>data = [[38, 'Soltero'],
[26, 'Casado'],
[26, 'Soltero'],
[38, 'Soltero'],
[24, 'Soltero'],
[28, 'Soltero'],
[30, 'Casado'],
[19, 'Soltero'],
[28, 'Soltero'],
[45, 'Casado'],
[27, 'Soltero'],
[41, 'Casado'],
[45, 'Casado'],
[38, 'Soltero']]
df_edad_estado_civil = pd.DataFrame(data, columns=list(['Estado_Civil', 'Edad']))
result = df_edad_estado_civil['Estado_Civil'].groupby(df_edad_estado_civil['Edad']).mean()
print (df_edad_estado_civil)
print (result)
</code></pre>
<p>结果是:</p>
<pre><code> Estado_Civil Edad
0 38 Soltero
1 26 Casado
2 26 Soltero
3 38 Soltero
4 24 Soltero
5 28 Soltero
6 30 Casado
7 19 Soltero
8 28 Soltero
9 45 Casado
10 27 Soltero
11 41 Casado
12 45 Casado
13 38 Soltero
Edad
Casado 37.400000
Soltero 29.555556
</code></pre>