如何正确使用gensim的deaccent方法？

from gensim.utils import deaccent def getTextFromFile(filename): with open(filename) as file: text = [line.rstrip() for line in file.readlines()] file.close() for line in text: print(deaccent(line)) return text

1条回答

网友

1楼 · 发布于 2024-06-03 14:06:04

据我所知，它运行良好：

Python 3.7.0 (default, Aug 22 2018, 20:50:05) 
Type "copyright", "credits" or "license" for more information.
IPython 4.1.2   An enhanced Interactive Python.
?         -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help      -> Python's own help system.
object?   -> Details about 'object', use 'object??' for extra details.
In [1]: from gensim.utils import deaccent
In [2]: deaccent('àéç')
Out[2]: 'aec'
In [3]: astr = 'àéç'
In [4]: dstr = deaccent(astr)
In [5]: print(dstr)
aec

如果希望getTextFromFile()方法返回取消重音的文本，则不要返回原始的text，而是返回deaccent()调用的结果

编程相关推荐

Java数组删除会产生意外的结果吗？
java启动Hudson服务器
java访问打包成jar文件的文件
java从InputStream读取到OutputStream的最快方式
java从手机图库中选择图像
java Hibernate Cirteria resultTransformer和一组子级
sonarqube如何将Java源代码与sonar中的作者联系起来
如何使用smtp服务器在java中发送具有动态发件人地址电子邮件id的电子邮件？
java等待firebase检索数据
如果文本为只读，则不会调用java JSF转换器

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何正确使用gensim的deaccent方法？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >