如何通过字符串变量迭代读取数据帧列信息

data = pd.read_csv('File') df = pd.Dataframe(data) print(df.columns) Index = (['Var_1', 'Var_1_Access', 'Var_1_comp1', 'Var_1_comp2', 'Var_2', 'Var_2_Access', 'Var_2_comp1', 'Var_2_comp2'], dtype='object')

Access_Matrix = [] for i in range(1, N + 1): Access_Matrix.append(df.f"Var_%i_Access" % i) Access_Matrix = [] for i in range(1, N + 1): Access_Matrix.append(df.Var_{i}_Access) Access_Matrix = [] for i in range(1, N + 1): Access_Matrix.append(df.Var_[i]_Access)

2条回答

网友

1楼 · 编辑于 2024-09-26 21:44:50

使用pandas.DataFrame.filter

它将使用正则表达式过滤列，并生成过滤版本

access_df = df.filter(regex=f'Var_\d_Access')

对于N的特定值或获取一个范围

access_df = df.filter(regex=f'Var_[1-{N}]_Access')

这种方法比使用粗循环更有效

网友

2楼 · 编辑于 2024-09-26 21:44:50

您不能使用“.”符号，但您应该可以在方括号中使用“f”字符串来执行此操作

for i in range(1, N + 1):
    Access_Matrix.append(df[f"Var_{i}_Access"])

或者，也许更好的方法是建立一个列名列表，并从df一次将它们提取到一个新的数据帧中，例如：

cols = [f"Var_{i}_Access" for i in range(1, N+1)]
all_cols = df[cols]

相关问题更多 >

编程相关推荐

热门问题

热门文章