如何在Python中优化迭代大数据帧的代码

2条回答

网友

1楼 · 编辑于 2024-07-03 07:44:55

关于迭代，我也有同样的问题。2分：

为什么不将NaN值替换为0？你可以这样做。它替换inf和nan值。在
看看这个This。也许你能理解，我有一个类似的问题，关于如何优化循环来计算实际行与前一行之间的去差。在

网友

2楼 · 编辑于 2024-07-03 07:44:55

使用pythonfor循环遍历一个大的pandas.DataFrame或numpy.ndarray，这通常是个坏主意。您应该在它们上使用可用的内置函数，因为它们是经过优化的，而且在许多情况下实际上不是用python编写的，而是用编译语言编写的。在您的例子中，您应该使用方法pandas.DataFrame.max和pandas.DataFrame.min，这两个方法都给了您一个选项skipna来跳过{}中的nan值，而无需手动删除它们。此外，您可以选择axis来最小化。所以您可以指定axis=1以获得沿列的最小值。在

这与@EdChum刚才在评论中提到的情况类似：

data.max(axis=1, skipna=True) - data.min(axis=1, skipna=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在Python中优化迭代大数据帧的代码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >