擅长:python、mysql、java
<p>这是我遵循的流程。在</p>
<p>首先,获取持有或缺失头寸的指标变量:</p>
<pre><code>position = pd.get_dummies(df['Position']).astype(bool)
not_position = ~pd.get_dummies(df['Position'], prefix='not').astype(bool)
df1 = pd.concat([df, position, not_position], axis=1)
</code></pre>
<p>接下来,产生可能的组合:</p>
^{pr2}$
<p>然后,删除重复项并提取仍然相关的字段</p>
<pre><code>df4 = df3[(df3['Analyst']) & (df3['Programmer_y']) & (df3['Supervisor_z'])]
df4.loc[:, ['Name', 'Name_y', 'Name_z', 'HourlyPay', 'HourlyPay_y', 'HourlyPay_z']]
Name Name_y Name_z HourlyPay HourlyPay_y HourlyPay_z
0 John Mike Lisa 15.0 18.0 16.75
1 Frank Mike Lisa 15.5 18.0 16.75
</code></pre>
<p>之后,您可以跨行取总和,删除新无用的pay列,并重命名剩余的列以返回uniqueDf这样的输出。在</p>