我有一个数据帧df
,如下所示:
我想创建一个新的dataframe newdf
,它有一列(uentries
),其中包含df
的唯一条目,以及{
因此,我的期望输出如下所示(uentries
不需要排序):
目前,我是这样做的:
import pandas as pd
import numpy as np
df = pd.DataFrame({'X1': ['a', 'b', 'c', 'd'],
'X2': ['c', 'e', 'nan', 'nan'],
'X3': ['a', 'c', 'e', 'nan']})
uniqueEntries = set([x for x in np.ravel(df.values) if str(x) != 'nan'])
newdf = pd.DataFrame()
newdf['uentries'] = list(uniqueEntries)
for coli in df.columns:
newdf[coli] = newdf['uentries'].isin(df[coli])
newdf.ix[:, 'X1':'X3'] = newdf.ix[:, 'X1':'X3'].astype(int)
这给了我想要的输出。在
是否可以更有效地填充newdf
?在
您可以将^{} 、^{} 和最后一个^{} 与^{} 一起使用:
如果在测试数据中使用
^{pr2}$np.nan
:这是一种使用
pd.value_counts
来解决这个问题的简单方法。在然后您可以只删除具有
^{pr2}$nan
值的行:相关问题 更多 >
编程相关推荐