2024-09-29 21:32:02 发布
网友
在列名不一致的地方,我要加载多种数据文件
理想情况下,我会转到pd.read_csv(file, index_col = 'patient_id')
pd.read_csv(file, index_col = 'patient_id')
但是在数据中我找到了id的列名,比如'patien_id','pat_id'等等
'patien_id','pat_id'
所以我觉得通过某种正则表达式会很好。有什么想法吗
最好的
您可以尝试使用正则表达式过滤数据帧中的列:
df = pd.read_csv(file) # read entire CSV into dataframe df = df.filter(regex=("pat.*_id")) # subset dataframe to only the columns you want
您可以尝试使用正则表达式过滤数据帧中的列:
相关问题 更多 >
编程相关推荐