我一直在尝试实现一个函数来更正多个文档中的拼写。我尝试了两种方法,即TextBlob
和autocorrect
。在
使用TextBlob
def spell_correct(word_list):
try:
corrected = []
for word in word_list:
w = Word(word)
corrected.append(w.correct())
return corrected
except UnicodeDecodeError:
return None
使用“自动更正”
^{pr2}$这两种方法都能很好地处理作为输入的单词列表。但是,当我在一个13k行的pandas DataFrame
中处理多个文档时,通常要花费keyboardInterrupt
的时间。我是不耐烦还是有更快的方法拼写正确?在
更新
这就是我如何将这些函数应用于pandas中的多个文档DataFrame
df['corrected_words'] = df.words.apply(lambda x: spell_correct(x))
目前没有回答
相关问题 更多 >
编程相关推荐