在保持清醒的同时保持文本的清醒

saniti的Python项目详细描述


#saniti

**快速、方便地清理文本文档列表,同时保持您的理智**


目的是将文档处理列表简化为相同的输出,从而只需指定文本列表并定义清理管道即可。


saniti
原始文本=[“我喜欢移动它,移动它”,“我喜欢移动它!”“,”of“]
text=saniti.saniti(Original_text,[”token“,”destop“,”depuunct“,”unempty“,”stem“,”out_corpu dict“])”我是说,[]]}
``````


**作为一个类**

````
impimport saniti i
sani1=sanitii.saniti1.saniti1.saniti1.saniti1.process初始化santisining类
text=sani1.process(original_text,[“token”,“destop”,“depunct”,“depuununct”,“unempty”,“unempty”,“lemma”,“out_tag_tag_tag_tag doc”])对saniti.process(originginginal_text,[“toxt”,“token”,“destop”,“destop”,“destop”,“destoop”,“depu“,”move“,”move“,”tags=['我喜欢move move']、taggeddocument(words=['i','likeing','move'],tags=['i likeing move'])、taggeddocument(words=[],tags=['')]
````

doc2vec
*“out_corp_dict”-将文本转换为gensim语料库和字典

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java的JPA/EntityManager是否提供了类似于Spring的RowMapper的机制   如何使用另一个实例列表在java中高效地创建实例列表   java关于JComboBox和JRadioButton   java Open WebView,带有来自Http post的结果   java应用中的安卓无关时间   java如何将类型集合参数传递给JPA中的存储过程?   整数除法java返回一个double?怎么回事?   cartitem和发票的java寿命关系。。购物车   Java正则表达式emptyString仅用于数字和。或者,需要数字   带有不可检查else的java IF语句   java如何改进这个解决缺少坐标的算法?   如何在Java中获得无序字符数组的唯一元素?   java我需要修改循环中的一个文本字符串,这样程序就可以复制粘贴相同的字符串,但数字会增加   java我有一个filewriter方法,它只在我关闭文件时输出到该文件   java Hana JBDC连接为不存在的数据库提供有效连接   Java中内部类方法与实例方法的区别   Java中循环周期的安卓延迟   lucene Java,找不到符号:方法methodName(org.bla.blabla.myClass)   java中的数字分隔