我能把正则表达式传给Pandas索引吗

2024-09-29 21:32:02 发布

您现在位置:Python中文网/ 问答频道 /正文

在列名不一致的地方,我要加载多种数据文件

理想情况下,我会转到pd.read_csv(file, index_col = 'patient_id')

但是在数据中我找到了id的列名,比如'patien_id','pat_id'等等

所以我觉得通过某种正则表达式会很好。有什么想法吗

最好的


Tags: csv数据idreadindex数据文件地方情况
1条回答
网友
1楼 · 发布于 2024-09-29 21:32:02

您可以尝试使用正则表达式过滤数据帧中的列:

df = pd.read_csv(file)              # read entire CSV into dataframe
df = df.filter(regex=("pat.*_id"))  # subset dataframe to only the columns you want

相关问题 更多 >

    热门问题