我定义了一个函数来执行我想要的任务,但是它非常慢。对于头为DataFrame (df1=pd.read(file1))
的'raw_data'
的DataFrame (df1=pd.read(file1))
,我当前使用.iterows
循环遍历每个字符串,并将每个条目发送给一个函数,该函数会进行剥离和降低,然后使用str.replace(row['replacethis'],row['withthis'])
,其中'replacethis'
和'withthis'
是第二个DataFrame ((df2=pd.read(file2))
中的列。你知道吗
但是,这是非常缓慢的,对于file1/file2的大量元素需要几天的时间。我已经找了好几个小时/天的解决方案,我尝试过使用series.str.replace
和列表压缩,但没有效果,比如:
'raw_data'=[[x['raw_data'].replace(y['replacethis'],y['withthis']) for y in df2.iterrows()] for x in df1.iterrows()]
有人能提供任何指导或建议吗?我快疯了。你知道吗
最好的方法可能是使用Pandas的DataFrame.replace方法:
结果:
相关问题 更多 >
编程相关推荐