Python主成分分析错误

2024-10-06 14:34:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在为我的数据清理课完成一项作业,在该课上我必须执行PCA。您不应该需要数据框架来帮助解决这个特定问题。我是一个Python迷。我花了3个小时试图自己解决这个问题,但没有成功。数据框已清理,异常已排序。我正在尝试创建一个PCA

这是我的密码:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
from pylab import rcParams
from sklearn.decomposition import PCA

df_pcs = pd.read_csv('/Users/personal/Desktop/Data set/churn_raw_data.csv', usecols=['Churn','Age', 'Income', 'Outage_sec_perweek','Yearly_equip_failure', 'Tenure', 'MonthlyCharge'])
data_numeric = df_pcs[['Age', 'Income', 'Outage_sec_perweek','Yearly_equip_failure', 'Tenure', 'MonthlyCharge']]
data_normed = (df_pcs - df_pcs.mean()) / df_pcs.std()
pca = PCA(n_components=2)
pca.fit(data_normed)
data_pca = pd.DataFrame(pca.transform(data_normed),columns = data_numeric)

我得到的错误:ValueError:索引数据必须是一维的

我不完全确定如何使索引数据是一维的。任何帮助都将不胜感激