在单词python的列上使用WordCloud

+-------------+-----+-----+------+ | words| A| B| C| +-------------+-----+-----+------+ | write| 1.0|2.083| 2.083| | trade|0.485|4.148| 2.012| | elite|0.333|5.969| 1.988| | mark| 0.5|3.897| 1.949| | quot|0.439|4.227| 1.856| | prostate| 0.25|7.416| 1.854| | maya| 0.25|7.416| 1.854| | lafayette|0.222|8.109| 1.8| | detail| 1.0|1.789| 1.789| | punta| 0.2|8.802| 1.76| |scorbutically| 0.2|8.802| 1.76| df.dtypes [('words', 'string'), ('A', 'double'), ('B', 'double'), ('C', 'double')]

1条回答

网友

1楼 · 发布于 2024-09-27 17:32:35

您可以尝试：

import matplotlib.pyplot as plt
from wordcloud import WordCloud
from collections import ChainMap
import pyspark.sql.functions as F

wordcloud = WordCloud(background_color="white")

words = dict(ChainMap(*df.select(F.create_map('words', 'C')).rdd.map(lambda x: x[0]).collect()))
# {'scorbutically': 1.76, 'punta': 1.76, 'detail': 1.789, 'lafayette': 1.8, 'maya': 1.854, 'prostate': 1.854, 'quot': 1.856, 'mark': 1.949, 'elite': 1.988, 'trade': 2.012, 'write': 2.083}

plt.imshow(wordcloud.generate_from_frequencies(words))

plt.show()

相关问题更多 >

编程相关推荐

热门问题

热门文章