如何在pandas中迭代数据帧列表？

def dropunnamednancols(df): """ Drop any columns staring with unnamed and NaN Args: df ([dataframe]): dataframe of which columns to be dropped """ #first drop nan columns df = df.loc[:, df.columns.notnull()] #then search for columns with unnamed df = df.loc[:, ~df.columns.str.contains('^Unnamed')] return df

2条回答

网友

1楼 · 编辑于 2024-09-30 12:15:34

如果我理解正确，您希望将一个函数分别应用于多个数据帧

基线问题是，在函数中，您返回一个新的数据帧，并用新的数据帧替换列表中存储的数据帧，而不是修改旧的原始数据帧

如果要修改原始值，必须使用函数的inplace=True参数。这是可能的，但不推荐，如here所示

因此，您的代码可能如下所示：

def dropunnamednancols(df):
    """
    Drop any columns staring with unnamed and NaN

    Args:
        df ([dataframe]): dataframe of which columns to be dropped
    """

    cols = [col for col in df.columns if (col is None) | (col.startswith('Unnamed'))]
    df.drop(cols, axis=1, inplace=True)

作为示例数据：

import pandas as pd
df_1 = pd.DataFrame({'a':[0,1,2,3], 'Unnamed':[9,8,7,6]})
df_2 = pd.DataFrame({'Unnamed':[9,8,7,6], 'b':[0,1,2,3]})

lst_dfs = [df_1, df_2]

[dropunnamednancols(df) for df in lst_dfs]

# df_1 
# Out[55]: 
#    a
# 0  0
# 1  1
# 2  2
# 3  3
# df_2
# Out[56]: 
#    b
# 0  0
# 1  1
# 2  2
# 3  3

网友

2楼 · 编辑于 2024-09-30 12:15:34

原因可能是您使用的枚举错误。在您的情况下，您只需要索引，因此您应该做的是：

for index in range(len(dfsublist)):
    ...

Enumerate返回索引的元组和列表中的实际值。因此，在您的代码中，循环变量索引实际上将被指定为：

(0, df1) # First iteration
(1, df2) # Second iteration
(2, df3) # Third iteration

因此，您可以正确使用enumerate并解压缩元组：

for index, df in enumerate(dfsublist):
    ...

或者，您完全放弃它，因为您可以通过任何一种方式使用索引访问值

相关问题更多 >

编程相关推荐

热门问题

热门文章