你得原谅我,因为我正在学习Python。我有一个Pandas
DataFrame
,包含以下worker属性列:Name、Position、HourlyPay。在
df
Index Name Position HourlyPay
0 John Analyst 15.00
1 Mike Programmer 18.00
2 Lisa Supervisor 16.75
4 Frank Analyst 15.50
我想输出到另一个DataFrame
(如下所示),其中包含{HourlyPay
,然后按最高的TotalHourlyPay
排序。在
uniqueDf
^{pr2}$我在上面的示例uniqueDf
中使用了3个位置,但有时这可能会改变。例如,2Analyst
位置可以同时工作,所以我想在需要时动态添加或删除多个position列。第二个例子如下。在
第二个示例df
Index Analyst Analyst Programmer Supervisor TotalHourlyPay
0 Frank John Mike Lisa 65.25
这是一个非常简单的大数据集示例。我尝试过这个问题,但是我的代码不值得展示。最接近的是在df.Name
列上使用itertools.combinations
。我试图通过在两个DataFrame
之间使用join
或{TotalHourlyPay
列,但我也无法使其正常工作。在
possibleCombinations = list(itertools.combinations(df.Name, 3))
uniqueDf = pd.DataFrame(possibleCombinations,columns=['Employee1','Employee2','Employee3'])
我只是想问问有没有人能帮我指出正确的方向。我知道这不是为你写代码,我绝对不想要。我真的很困惑下一步该怎么做,谷歌Chrome上的每一个链接都会被点击高亮显示。非常感谢任何帮助。在
谢谢你
这是我遵循的流程。在
首先,获取持有或缺失头寸的指标变量:
接下来,产生可能的组合:
^{pr2}$然后,删除重复项并提取仍然相关的字段
之后,您可以跨行取总和,删除新无用的pay列,并重命名剩余的列以返回uniqueDf这样的输出。在
此代码将给出您想要的结果:
相关问题 更多 >
编程相关推荐