回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我的数据在列表中。你知道吗</p>
<pre><code>data = [['Biz_Innovations', '#socialmedia'],
['ChantalGrange', '#aws'],
['beyonddevops', '#aws'],
['beyonddevops', '#socialmedia'],
['IBMNetezza', '#ibm'],
['IBMNetezza', '#analytics'],
['SandraFeinsmith', '#ibm'],
['SandraFeinsmith', '#analytics'],
['fleejack', '#healhcare'],
['bigdataweek', '#socialmedia'],
['sabumjung', '#aws']]
</code></pre>
<p>我想计算第二列中单词的频率(例如,#socialmedia,#aws),然后根据频率选择行。如果这个词在数据集中出现三次或更多次,我希望保留相应的行(其他行将被删除)。结果如下:</p>
<pre><code>data = [['Biz_Innovations', '#socialmedia'],
['ChantalGrange', '#aws'],
['beyonddevops', '#aws'],
['beyonddevops', '#socialmedia'],
['bigdataweek', '#socialmedia'],
['sabumjung', '#aws']]
</code></pre>
<p>有什么建议吗?你知道吗</p>