Python中文
首页
教程
问答
标签
搜索
登录
注册
Collections.counter()正在计算字母而不是单词
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我必须从数据帧的第<code>df['messages']</code>行中统计最多出现的单词数。它有许多列,所以我将所有行格式化并存储为单个字符串(单词按空格连接),存储在一个variabel<code>all_words</code>中<code>all_words</code>所有单词都用空格分隔。但当我试着数一数最常用的单词时,它显示了我最常用的字母表。 我的数据格式如下:</p> <pre><code>0 abc de fghi klm 1 qwe sd fd s dsdd sswd?? 3 ded fsf sfsdc wfecew wcw. </code></pre> <p><strong>这是我的代码片段。</strong></p> <pre><code> from collections import Counter all_words = ' ' for msg in df['messages'].values: words = str(msg).lower() all_words = all_words + str(words) + ' ' count = Counter(all_words) count.most_common(3) </code></pre> <p>这是它的输出:</p> <pre><code>[(' ', 5260), ('a', 2919), ('h', 1557)] </code></pre> <p>我还尝试使用<code>df['messages'].value_counts()</code>。但它返回使用最多的行(整个句子)而不是单词。 比如:</p> <pre><code>asad adas asda 10 asaa as awe 3 wedxew dqwed 1 </code></pre> <p>请告诉我哪里错了,或者建议其他可行的方法</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>from collections import Counter all_words = [] for msg in df['messages'].values: words = str(msg).lower().strip().split(' ') all_words.extend(words) count = Counter(all_words) count.most_common(3) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
6 回答
如何添加表示整数的擦边字符串?
2 回答
如何添加要在Bokeh中使用的新font.ttf文件?
8 回答
如何添加要显示的矩阵XY轴编号和XY轴
5 回答
如何添加计数?
1 回答
如何添加计数器函数?
6 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
8 回答
如何添加计数器来跟踪while循环中的月份和年份?
2 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
8 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
8 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
1 回答
如何添加评论拉梅尔亚姆
2 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
10 回答
如何添加谷歌地点自动完成到Flask?
1 回答
如何添加超时、python discord bot
3 回答
如何添加超过1dp的检查
4 回答
如何添加距离方法
4 回答
如何添加跟随游戏的敌人精灵
7 回答
如何添加路径以便python可以找到程序?
2 回答
如何添加身份验证/安全性以使用happybase访问HBase?
9 回答