擅长:python、mysql、java
<p>谢谢大家的帮助!使用数据表正如@shadowtalker建议的那样,极大地加快了这个过程。仅供参考,以防有人试图做类似的事情,df1大约是400MB,我的df2文件大约是3gb。在</p>
<p>我完成了以下任务:</p>
<pre><code>library(data.table)
df1 <- setDT(df1)
df2 <- setDT(df2)
setkey(df1, Name)
setkey(df2, Name)
df3 <- df1[df2, nomatch = 0]
</code></pre>