我正在处理Allstate data from Kaggle。
我循环遍历分类列以创建虚拟列,但是pd.drop()
没有删除我的列。我试过了
for i in range(44):
dummies1 = pd.get_dummies(combined[cols_cat[i+71]], prefix=cols_cat[i+72])
combined = pd.concat([combined,dummies1], axis=1)
combined = combined.drop(combined[cols_cat[i+71]], axis=1)
或者
^{pr2}$但是当我选中combined.head()
时,虚拟对象创建得很好,但是原始列仍然保留。drop函数总是给我带来麻烦,我觉得在经过大量的使用/研究之后,我仍然无法理解drop函数的inplace
部分。
这里,cols_cat
是我先前创建的列名数组。在
cols_cat = train.iloc[:,1:117].columns
cols_cont = train.iloc[:,117:131].columns
我正在创建一个模型数据帧供人们尝试,这样更容易回答。在那之前,有人发现我犯了什么根本性的错误吗?在
这样做:
或者
^{pr2}$根据pandas documentation,}从索引中删除标签。在
axis=1
从列中删除标签,而{相关问题 更多 >
编程相关推荐