基于Python和pandas的文本挖掘

import pandas as pd pda = pd.DataFrame.from_dict({'Word': ['bank', 'hold', 'banking', 'holding', 'bank'], 'Porter': ['bank', 'hold', 'bank', 'hold', 'bank'], 'SomeData': ['12', '13', '12', '13', '12']}) pdm = pd.DataFrame(pda.groupby(['Porter'])['Word'].apply(list))

1条回答

网友

1楼 · 发布于 2024-09-27 22:20:19

您可以对此应用集合而不是列表，因此您将自动删除所有重复项：

import pandas as pd
pda = pd.DataFrame.from_dict({'Word': ['bank', 'hold', 'banking', 'holding', 'bank'], 
                              'Porter': ['bank', 'hold', 'bank', 'hold', 'bank'], 
                              'SomeData': ['12', '13', '12', '13', '12']})

pdm = pd.DataFrame(pda.groupby(['Porter'])['Word'].apply(set))

编程相关推荐

java搜索具有外键的JPA实体的约定是什么？
java事务没有使用事务和嵌套方法的2个实例回滚
SpringBootJavaMessageFormat。使用umlauts格式（ä/ö/ü）
java如何通过字符串在sqlite中搜索列
JAVAlang.ClassNotFoundException:org。冬眠Hibernate4的例外情况
java消息正文在Gmail中被弄乱了
java Apache Ignite未使用空值更新缓存
Java正则表达式未捕获组
java onBackPressed（）；除非我叫super否则不行。onBackPressed（）；两次密码
java CustomAlertDialog在删除数据库记录后未完成其进程

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于Python和pandas的文本挖掘

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >