用Python构建单词词库

2024-09-28 01:28:22 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个单词列表，这些单词是我的用户在清理后输入的（为了纠正拼写错误）我有下面的列表，每一行代表一个字符串以及这个字符串被输入的次数：

Pepsi        500
Coke         358
Dr. pepper   254
Sprite       204
Coca cola    159
7 up         140
Mountain dew 137
Diet coke    58
Mtn. dew     50

现在我想有一个脚本，将通过这个列表和分组相似的词。例如，将可口可乐、可口可乐和健怡可乐合并为一组（因为它们是可口可乐的同义词）。在

我看到在NLTK WordNet中有一些相似函数，我可以使用它们吗？还是有更好的方法来解决这个问题？在

Tags：字符串用户列表代表单词次数 sprite dr

0条回答

目前没有回答

编程相关推荐

java如何使用Flyway回滚迁移？
sql试图在java中连接两个表，但我遇到了一个错误
java使用commons apache API复制文件内容
java无法解析模块
原因：java。lang.IllegalArgumentException:org。冬眠QueryException:无法解析属性：
java使用TNT4J，TrackingLogger统计数据仅显示该类的统计数据，如果我想要应用程序范围的统计数据呢？
java项目Euler#19，答案只有在1900年开始时才正确？
java显示标签上的选定值列表
java在局部变量中缓存属性吗？
java preparedStatement。setString（1，“null”）被解释为null而不是字符串（在preparedStatement.addBatch（）之后）

热门问题

为什么在使用strptime时会出现未进行转换的数据错误？
3 个回答
为什么在使用strptim时会出现这个datetime日期错误
9 个回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
6 个回答
为什么在使用sum（）函数时会发生“int”对象不可调用的错误？
10 个回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”？
11 个回答
为什么在使用tabla时会得到一个空的数据帧？
4 个回答
为什么在使用tensorboard时需要add_graph（）的第二个参数？
4 个回答
为什么在使用TensorFlow Lite转换YOLOv4时，推断时间/大小没有改进？有什么可能的改进吗？
9 个回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏？
9 个回答
为什么在使用tensorflow时会收到警告/错误（使用函数API，但未实现错误）
7 个回答
为什么在使用tetpyclient发出POST请求时出现403错误？
1 个回答
为什么在使用TextBlob时会出现HTTP错误？
3 个回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature？
10 个回答
为什么在使用timedelta格式化之后，我在python中的日期是错误的？
10 个回答
为什么在使用timeit或exec函数时，函数中的变量不会在提供的全局命名空间中搜索？
9 个回答
为什么在使用tkinter时不能使用复选框？
9 个回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID？
5 个回答
为什么在使用TQM时，在调整图像大小时，处理时间会有很大的差异？
8 个回答
为什么在使用Tweepy下载用户时间线时收到错误消息
8 个回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000？
3 个回答

用Python构建单词词库

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Python构建单词词库

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >