我在学习机器学习。在学习KMN算法时,需要对数据进行缩放。当我应用它时,它给了我一个值错误
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv(r'C:\Users\admin\Documents\milemarkers.csv')
df.head()
->
OBJECTID REF_PT_ID HWY REF_PT_NUM ROUTE_ID_RIMS
0 10060 52.000 14 52.000000 192
1 10061 54.167 29 54.167000 14
2 10062 122.000 94 122.000000 15
3 10063 0.000 48 0.000000 229
4 10064 196.014 29 196.014008 14
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(df)
scaled_features = scaler.transform(df)
df_feat = pd.DataFrame(scaled_features,columns = df.columns[:-1])
ValueError: Shape of passed values is (9738, 5), indices imply (9738, 4)
不就是因为你忽略了最后一列吗?很明显,使用[:-1]你就成功了(9738,4) 正确的形式是
我不认为你应该缩放OBJECTID列
选择特征并缩放它们
添加原始数据帧中未缩放的列
数据
相关问题 更多 >
编程相关推荐