我的目标是读取文件中的行,并用普通字符(a,e,c,…)替换所有特殊字符,如法语字符(a,e,ç,…)
我使用的是python3,在gensim的文档中,这个例子使用的是一个简单的句子,比如:deaccent(“戥戥ç”),但不使用我从文件中读取的行 在这个时候,我的代码只得到了“戥戥”而不是“aec”
from gensim.utils import deaccent
def getTextFromFile(filename):
with open(filename) as file:
text = [line.rstrip() for line in file.readlines()]
file.close()
for line in text:
print(deaccent(line))
return text
我的文件包含:ç
我想得到:aec
据我所知,它运行良好:
如果希望
getTextFromFile()
方法返回取消重音的文本,则不要返回原始的text
,而是返回deaccent()
调用的结果相关问题 更多 >
编程相关推荐