我有一个数据帧,其中包含如下序列:
0 CollgCr
1 Veenker
2 CollgCr
3 Crawfor
4 NoRidge
5 Mitchel
6 Somerst
7 NWAmes
8 OldTown
9 BrkSide
基于这个系列,我想通过对它们进行分组来创建一个新的列(特性)。你知道吗
例如,如果数据是CollgCr或venker,那么新列中的值将是“Middle”
我试着使用以下代码
df_full['NeighborGrp'] = "Upper"
df_full['NeighborGrp'].loc[df_full["Neighborhood"] == "CollgCr"] = "Middle"
df_full['NeighborGrp'].loc[df_full["Neighborhood"] == ["Mitchel", "OldTown", "BrkSide", "Sawyer", "NAmes", "IDOTRR",
"MeadowV", "Edwards", "NPkVill", "BrDale", "SWISU", "Blueste"]] = "Lower"
第一行和第二行运行良好,但第三行返回错误“ValueError: Arrays were different lengths"
padas中有没有特殊的语法允许我基于这样的多值条件创建一个新列?你知道吗
谢谢
如果有一个表可以表示City和Type之间的关系,^{} 将是一种更直接的方法(无需在脚本中硬编码每个City):
使用^{} by } 表示不匹配的值:
dictionary
和^{或创建动态词典:
它取决于数据,但是
map
应该是最快的:计时代码:
使用^{} 和^{}
相关问题 更多 >
编程相关推荐