我在一个大数据帧上使用pandas 0.18.1。我被value_counts()
的行为弄糊涂了。这是我的代码:
print df.phase.value_counts()
def normalise_phase(x):
print x
return int(str(x).split('/')[0])
df['phase_normalised'] = df['phase'].apply(normalise_phase)
这将打印以下内容:
^{pr2}$两个问题:
nan
打印为normalise_phase
的输出,而nan
不是列为value_counts
中的值?在value_counts
将dtype
显示为int64
,如果它有以下字符串值:
1/2
和{
您需要传递
dropna=False
以计算nan(请参见docs)。int64
是序列的数据类型(值的计数)。值本身就是索引。如果您检查,索引的数据类型将是object。在相关问题 更多 >
编程相关推荐