<ul>
<li>如果<code>data</code>是一个<code>DataFrame</code>,并且它同时包含<code>user_id</code>和<code>operations_per_user</code>列,则应该使用以下内容执行删除:</li>
</ul>
<pre><code>data = data.drop(data.loc[data['operations_per_user'] <= 3].index)
</code></pre>
<p><strong>编辑</p>
<p>不必创建单独的序列,您可以使用以下命令将<code>operations_per_user</code>添加到<code>data</code>:</p>
<pre><code>data['operations_per_user'] = data.loc[:, 'user_id'].value_counts()
</code></pre>
<p>您可以如上所述执行拖放,也可以使用反向逻辑条件执行选择:</p>
<pre><code>data = data.loc[data['operations_per_user' > 3]]
</code></pre>
<p><strong>原创</strong></p>
<p>如果您能提供更多关于代码中使用的变量的信息,那就更好了。你知道吗</p>
<ul>
<li>如果<code>operations_per_user</code>是一个大熊猫<code>Series</code>,您的第一个循环可以通过以下方法得到改进:</li>
</ul>
<pre><code>undesirable_users=[]
for i in operations_per_user.index:
if operations_per_user.loc[i] <= 3:
undesirable_users.append(i)
</code></pre>
<p>函数<code>get_value()</code>已弃用,请改用<code>loc</code>或<code>iloc</code>。<a href="https://stackoverflow.com/questions/31593201/how-are-iloc-ix-and-loc-different">This</a>是<code>loc</code>和<code>iloc</code>的一个很好的总结,而<a href="https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf" rel="nofollow noreferrer">here</a>是一个很好的参考资料。你知道吗</p>
<ul>
<li>可以将python列表用作迭代器;对于第二个循环:</li>
</ul>
<pre><code>for user in undesirable_users:
data = data.drop(data.loc[data['user_id'] == user].index)
</code></pre>