如何比较python3中的两个频率分布(使用nltk FreqDist创建)?

2024-10-02 14:28:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用nltk FreqDist创建频率分布使用python3。我想把整个语料库的频率分布和许多文本文件的频率分布逐一进行比较。另外,我想输出一些比较的数值。你知道吗

微粒子=[]

对于文档集中的文档:

    corpusTokens.extend(document)
    fdist = FreqDist(self.corpusTokens)

如何比较整个语料库的fdist和一些文本文件的fdist?你知道吗


Tags: 文档selfdocumentpython3数值频率语料库文本文件