擅长:python、mysql、java
<p>这里有一种方法,利用熊猫会自动填充缺失索引的NaN。在</p>
<p>首先准备数据。您可能已经完成了这一步。在</p>
<pre><code>df1 = pd.read_csv(r'c:\temp\test1.txt', sep=' ')
df1
Out[30]:
year description field
0 1993 bar0 a01arb92
1 1993 bar1 a01svb92
2 1993 bar2 a01fam92
3 1993 bar3 a08
4 1993 bar4 a01bea93
df1 = df1.set_index(['year', 'description', 'field'])
df2 = pd.read_csv(r'c:\temp\test2.txt', sep=' ')
df2
Out[33]:
year description field
0 1993 bar0 a01arb92
1 1993 bar1 a01svb92
2 1993 bar3 a08
3 1993 bar4 a01bea93
df2 = df2.set_index(['year', 'description', 'field'])
</code></pre>
<p>接下来,在df2中创建一个新列,并使用pandas将这些列复制到上一个数据帧。这将填充缺失值的NaN。然后使用<code>fillna</code>指定一个值0。在</p>
^{pr2}$