如何在pandas数据框中使用列表作为值？

2条回答

网友

1楼 · 编辑于 2024-05-10 09:20:32

看起来熊猫正试图将序列中的所有列表相加并除以行数。这将导致列表连接，结果将无法通过数字类型检查。这解释了错误中的列表。

你可以这样计算平均值：

df['runtimes'].apply(numpy.mean)

除此之外，pandas不喜欢将列表用作值。如果数据是表格式的，请考虑将列表分成三列。

序列化列的工作方式与此类似：

df['runtimes'].apply(lambda x: '"' + str(x)[1:-1] + '"')

网友

2楼 · 编辑于 2024-05-10 09:20:32

感觉你在试图让熊猫变成另一种东西。如果始终有3个运行时，则可以生成3列。然而，Pandas-esqe的方法越多，就是将数据（不管你有多少个不同的试验）标准化为如下内容：

df = [{"condition": "a", "trial": 1, "runtime": 1},
      {"condition": "a", "trial": 2, "runtime": 1.5},
      {"condition": "a", "trial": 3, "runtime": 2},
      {"condition": "b", "trial": 1, "runtime": .5},
      {"condition": "b", "trial": 2, "runtime": .75},
      {"condition": "b", "trial": 3, "runtime": 1}]
df = pd.DataFrame(df)

那你就可以

print df.groupby('condition').mean()


           runtime  trial
condition                
a             1.50      2
b             0.75      2

这里的概念是保持数据表格式，并且每个单元格只有一个值。如果要执行嵌套列表函数，则应使用列表，而不是Pandas数据帧。

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在pandas数据框中使用列表作为值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >