Python中文
首页
教程
问答
标签
搜索
登录
注册
加快Pandas数据帧的搜索速度
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个名为<code>real_info</code>的数据帧,它有3列,例如:</p> <pre><code> Source Target Interaction 0 MAP7D1 APOA1 physical 1 MAP7D1 RBM48 physical 2 MAP7D1 GPRASP1 physical 3 MAP7D1 COPS6 physical 4 USP20 MAP7D1 physical </code></pre> <p>我将这些列编入一个新的数据框,认为搜索会很快:</p> ^{pr2}$ <p>我有5000个字符串的名称列表,我在<code>new_df</code>中搜索这对字符串。如果存在匹配项,则我将存储在一个文件中,例如:</p> <pre><code>for names_A in name_list: for names_B in name_list: res = df.query('Source == "{}" & Target == "{}"'.format(names_A,names_B)) if len(res.index.tolist()) > 0: res.to_csv('nets.csv', mode='a', header=False) </code></pre> <p>这个过程是可行的,但是在5000 X 5000列表中搜索对是非常缓慢的。有什么改进的建议吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>IIUC:(非常感谢@cᴏʟᴅsᴘᴇᴇᴅ和@Bharath指出了错误!)在</p> <pre><code>res = df.loc[df['Source'].isin(name_list) & df['Target'].isin(name_list)] res.to_csv(...) </code></pre> <p>演示:</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
1 回答
如何在python中从数据帧列表中删除引号
3 回答
如何在python中从数据帧创建列表
5 回答
如何在Python中从数据帧创建嵌套的JSON
2 回答
如何在Python中从数据帧显示wordcloud
5 回答
如何在Python中从数据帧的时间戳中删除字符
10 回答
如何在Python中从数据帧绘制简单绘图?
3 回答
如何在python中从数据帧行提取具有特定长度的范围?
7 回答
如何在python中从数据帧设置dict中的值
1 回答
如何在Python中从数据库中获得一个结果
4 回答
如何在python中从数据框中绘制分类条形图
8 回答
如何在Python中从数据框中选择特定细节?
4 回答
如何在python中从数据集中删除unicode
4 回答
如何在python中从数据集中删除某些数值?
4 回答
如何在python中从数据集中选择行
9 回答
如何在Python中从数组中删除元素
8 回答
如何在python中从数组中删除单个倒逗号?
9 回答
如何在python中从数组中删除对象?
6 回答
如何在python中从数组中删除引号
7 回答
如何在python中从数组中删除所有最小值
5 回答