擅长:python、mysql、java
<p>这会修改原始df,所以您可能需要先复制它</p>
<pre><code>from collections import Counter
df["message"] = df["message"].apply(lambda message: message + " ")
df.groupby(["Final Category"]).sum().applymap(lambda message: Counter(message.split()))
</code></pre>
<p>此代码的作用:首先,它在所有消息的末尾添加一个空格。这个稍后再来。
然后按最后一个类别进行分组,并对每组中的消息进行汇总。这就是尾随空格很重要的地方,否则消息的最后一个单词将粘在下一个单词的第一个单词上。(求和是字符串的串联)</p>
<p>然后将字符串沿空格分割得到单词,然后进行计数。在</p>