迭代系列/列的最快方法

2条回答

网友

1楼 · 编辑于 2024-09-25 12:26:36

如果您最终想要将新名称添加到df，您可以通过以下方式直接添加：

df['newnames'] = df['name'].str.replace(' ', '_')

如果只想将name列更改为用_替换所有空格，也可以直接在原始列上执行此操作（覆盖它），如下所示：

df['name'] = df['name'].str.replace(' ', '_')

在这两种方式中，我们都是使用Pandas的矢量化操作来完成的，该操作已针对更快的执行进行了优化，而不是使用尚未优化且速度较慢的循环

网友

2楼 · 编辑于 2024-09-25 12:26:36

只需使用矢量化字符串操作：

newnames = df['name'].str.replace(' ', '_', regex=False).tolist()

通常，对于熊猫，如果可能的话，你希望避免做循环。如果您在库中查找，通常有一些方法可以绕过循环，因此有一些关于Pandas的语法研究（除非您正在查找的是非常不标准的）

基本上，如果你想做的事情表面上需要一个for循环，那么做可能是人们经常想做的事情，它可能在图书馆里