我正在写一个文本微调器,它工作正常。但可读句子的准确性很低,因为它只是使用我从数据库中得到的词典。像这样的回扣税
{Your} {home| house| residence| property} {is} {your} {castle| mansion| fortress| palace}
并传递给一个函数,该函数根据用户的原始输入随机选择同义词和输出句子。例如输入:
^{pr2}$会回来的
Your property is your mansion.
现在我想加入人工智能,因为它会使我的输出语句更具可读性。我想知道如何使用naivebayes做出更好的选择。我知道我可能需要训练才能取得更好的成绩。在
这是我目前的选词方法,现在很简单。在
def spin(spintax):
while True:
word, n = re.subn('{([^{}]*)}',lambda m: random.choice(m.group(1).split("|")),spintax)
if n == 0: break
return word.strip()
提前谢谢你们,如果你们需要我发布更多的代码让我知道
也许你可以下载谷歌从所有英文书籍中收集的数据集,然后用ngrams生成随机句子?https://books.google.com/ngrams
实现是使用Markov chain,其中下载的数据为下一个单词提供了选择的概率。在
这可能会结束,因为您的问题没有简明的答案,但您可能需要查看nltk wordnet:
https://pythonprogramming.net/wordnet-nltk-tutorial/
相关问题 更多 >
编程相关推荐