使用TextBlob,au更正拼写

2024-06-25 23:25:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在尝试实现一个函数来更正多个文档中的拼写。我尝试了两种方法,即TextBlobautocorrect。在

使用TextBlob

def spell_correct(word_list):
    try:
        corrected = []
        for word in word_list:
            w = Word(word)
            corrected.append(w.correct())
        return corrected
    except UnicodeDecodeError:
        return None

使用“自动更正”

^{pr2}$

这两种方法都能很好地处理作为输入的单词列表。但是,当我在一个13k行的pandas DataFrame中处理多个文档时,通常要花费keyboardInterrupt的时间。我是不耐烦还是有更快的方法拼写正确?在

更新 这就是我如何将这些函数应用于pandas中的多个文档DataFrame

df['corrected_words'] = df.words.apply(lambda x: spell_correct(x))

Tags: 方法函数文档dataframepandasdfreturnlist