使用naivebayes的文本微调器

2024-06-26 00:06:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在写一个文本微调器,它工作正常。但可读句子的准确性很低,因为它只是使用我从数据库中得到的词典。像这样的回扣税

{Your} {home| house| residence| property} {is} {your} {castle| mansion| fortress| palace}

并传递给一个函数,该函数根据用户的原始输入随机选择同义词和输出句子。例如输入:

^{pr2}$

会回来的

Your property is your mansion.

现在我想加入人工智能,因为它会使我的输出语句更具可读性。我想知道如何使用naivebayes做出更好的选择。我知道我可能需要训练才能取得更好的成绩。在

这是我目前的选词方法,现在很简单。在

def spin(spintax):
    while True:
        word, n = re.subn('{([^{}]*)}',lambda m: random.choice(m.group(1).split("|")),spintax)
        if n == 0: break
return word.strip()

提前谢谢你们,如果你们需要我发布更多的代码让我知道


Tags: 函数文本数据库homeyourisproperty句子
2条回答

也许你可以下载谷歌从所有英文书籍中收集的数据集,然后用ngrams生成随机句子?https://books.google.com/ngrams

实现是使用Markov chain,其中下载的数据为下一个单词提供了选择的概率。在

这可能会结束,因为您的问题没有简明的答案,但您可能需要查看nltk wordnet:

https://pythonprogramming.net/wordnet-nltk-tutorial/

相关问题 更多 >