python中nlp的词汇管理。

vocab的Python项目详细描述


Documentation Statushttps://travis-ci.org/vzhong/vocab.svg?branch=master

vocab是一个python包,它为自然语言处理提供词汇表对象。

安装

pip install vocab
pip install git+https://github.com/vzhong/vocab.git

用法

>>>fromvocabimportVocab,UnkVocab>>>v=Vocab()>>>v.word2index('hello',train=True)0>>>v.word2index(['hello','world'],train=True)[0,1]>>>v.index2word([1,0])['world','hello']>>>v.index2word(1)'world'>>>small=v.prune_by_count(2)>>>small.to_dict(){'counts':{'hello':2},'index2word':['hello']}>>>u=UnkVocab()>>>u.word2index(['hello','world'],train=True)[1,2]>>>u.word2index('hello friend !'.split())[1,0,0]>>>u.index2word(0)'<unk>'

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用CSPRNG中的序列种子PRNG安全吗?   java如何使JTable列大小与内容精确(或紧密)匹配?   java Android textview具有两种不同大小的文本   java在任意事物的列表(数组)中创建关联的最佳方法是什么?   java保存可扩展字符串?   java成员类(内部类)如何访问外部类的实例变量?   java使用Android 6.0(API级别23)使用rest的最佳方式是什么   java为什么我会收到“学习记录”。Student@25a43blb'尝试显示链接列表中的所有对象时?   java如何将SVG文本转换为SVG路径?   java Paypal返回URL参数支付状态   java Libgdx:导出到可运行Jar   java JPA获取连接实体的最小/最大属性   附加到类型变量的java编号?   java Object[]到底是什么?   java如何在安卓中的片段和活动之间共享数据   java使用MinGW为windows构建linux库   java将变量值传递给eval函数   java仅在转换完成时使方法返回   Java二维数组对角线