回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我很难弄清楚如何“混合”两个数据帧。我要做的是用在类似的数据帧中找到的值来填充数据帧<code>df_A</code>中的“缺失”值。我试过不同版本的<code>join</code>
但显然还没有得出结果。你知道吗</p>
<p>此外</p>
<p>例如</p>
<pre><code>dict_a = {'ID' : ['id_a', 'id_b', 'id_c', 'id_c'], 'A': ['Hello', 2, 3, 3], 'B': [3, 4, 5, 55], 'C': [11, 'World', 15, 25], 'Date': ['2018-10-23', '2018-10-23', '2018-10-23', '2018-10-24']}
dict_b = {'ID' : ['id_c', 'id_a'], 'A': [np.nan, 31], 'B': [np.nan, 55], 'C': [11, np.nan], 'Date': ['2018-10-23', '2018-10-23']}
df_A = pd.DataFrame(data=dict_a)
df_B = pd.DataFrame(data=dict_b)
>> df_A
>> A B C ID Date
0 Hello 3 11 id_a 2018-10-23
1 2 4 World id_b 2018-10-23
2 3 5 15 id_c 2018-10-23
3 3 55 25 id_c 2018-10-24
>> df_B
>> A B C ID Date
0 NaN NaN 11.0 id_c 2018-10-23
1 31.0 55.0 NaN id_a 2018-10-23
</code></pre>
<p>期望的结果应该像(伪代码)</p>
<pre><code>>> df_blended = df_B.values if df_A.isnan() else df_A.values where df_A.ID = df_B.ID and df_A.Date= df_B.Date
>> df_blended
>> A B C ID Date
0 3 5 11.0 id_c 2018-10-23
1 31.0 55.0 11 id_a 2018-10-23
</code></pre>
<p>所以,优先使用dfu-B,其次使用df-A,希望可以理解!你知道吗</p>
<p>谢谢</p>