pandas-按另一个数据帧按行元素筛选数据帧问题的回答

pandas-按另一个数据帧按行元素筛选数据帧

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

在由所需列构造的多索引上使用<code>isin</code>可以有效地执行此操作： <pre><code>df1 = pd.DataFrame({'c': ['A', 'A', 'B', 'C', 'C'], 'k': [1, 2, 2, 2, 2], 'l': ['a', 'b', 'a', 'a', 'd']}) df2 = pd.DataFrame({'c': ['A', 'C'], 'l': ['b', 'a']}) keys = list(df2.columns.values) i1 = df1.set_index(keys).index i2 = df2.set_index(keys).index df1[~i1.isin(i2)] </code></pre> <a href="https://i.stack.imgur.com/CJLkf.png" rel="noreferrer"><img src="https://i.stack.imgur.com/CJLkf.png" alt="enter image description here"/></a> 我认为这改进了@IanS的类似解决方案，因为它不假定任何列类型（即它可以处理数字和字符串）。 <hr/> （以上答案是编辑。以下是我的初步回答） 有趣！这是我以前从未遇到过的。。。我可能会通过合并两个数组，然后删除定义<code>df2</code>的行来解决这个问题。下面是一个使用临时数组的示例： <pre><code>df1 = pd.DataFrame({'c': ['A', 'A', 'B', 'C', 'C'], 'k': [1, 2, 2, 2, 2], 'l': ['a', 'b', 'a', 'a', 'd']}) df2 = pd.DataFrame({'c': ['A', 'C'], 'l': ['b', 'a']}) # create a column marking df2 values df2['marker'] = 1 # join the two, keeping all of df1's indices joined = pd.merge(df1, df2, on=['c', 'l'], how='left') joined </code></pre> <a href="https://i.stack.imgur.com/TvDMi.png" rel="noreferrer"><img src="https://i.stack.imgur.com/TvDMi.png" alt="enter image description here"/></a> <pre><code># extract desired columns where marker is NaN joined[pd.isnull(joined['marker'])][df1.columns] </code></pre> <a href="https://i.stack.imgur.com/CJLkf.png" rel="noreferrer"><img src="https://i.stack.imgur.com/CJLkf.png" alt="enter image description here"/></a> 可能有一种不使用临时数组的方法，但是我想不出一种。只要你的数据不是很大，上面的方法应该是一个快速和充分的答案。

pandas-按另一个数据帧按行元素筛选数据帧

1 个回答

相关Python问题