擅长:python、mysql、java
<p>使用<code>drop_duplicates</code>删除每个帖子中的重复标记,然后可以使用<code>value_counts</code></p>
<pre><code>df.Posts.str.extractall(
r'(\#\w+)'
).reset_index().drop_duplicates(['level_0', 0])[0].value_counts()
</code></pre>
<p>更短的备选方案,其中<code>level=0</code>被传递给<code>reset_index</code></p>
^{pr2}$
<p>两者都将输出:</p>
<pre><code>#tag1 3
#tag3 1
#tag2 1
Name: 0, dtype: int64
</code></pre>