在列表列中计算唯一元素的有效方法？

2条回答

网友

1楼 · 编辑于 2024-09-26 18:07:14

例如，您可以使用下一个变体：

from itertools import chain
from operator import methodcaller

import pandas as pd

df = pd.DataFrame({
    "words": [
        "we like to party",
        "can can dance",
        "yes we can"
    ]
})

print(len(set(
    chain.from_iterable(
        map(methodcaller("split", " "), df.words.values)
    )
)))

网友

2楼 · 编辑于 2024-09-26 18:07:14

我认为您需要由连接词和拆分词创建的集合长度：

a = len(set(' '.join(df['words']).split()))
print (a)
7

如果有使用集合理解的列表，谢谢@juanpa.arrivillaga:

print (df)
                   words
0  [we, like, to, party]
1      [can, can, dance]
2         [yes, we, can]


a = len({y for x in df['words'] for y in x})
print (a)
7

编程相关推荐

java如何拆分字符串（基于各种分隔符），但不保留空格？
解析。Json格式的txt文件和knime中的java
java Spring rest api为什么在rest api调用的响应中更改了数据类型
升华文本3抛出java。lang.ClassNotFoundException，而记事本++不存在
java Android指纹扫描仪在尝试5次后停止工作？
java Android如何设置精确的重复报警？
java如何使用HTTPGET connect为access API输入用户名和密码
java当测试报告显示没有测试失败时，Gradle为什么说“有失败的测试”？
用Gson实现java获取响应
MapReduce程序中函数错误的java不可映射参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

在列表列中计算唯一元素的有效方法？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >