基于rnn的文字嵌入模型

chars2vec的Python项目详细描述


chars2vec库在处理包含缩写、俚语、拼写错误或其他特定文本数据集的文本时非常有用。chars2vec语言模型基于单词的符号表示——该模型将每个单词映射到一个固定长度的向量。这些向量表示是通过一个自定义的神经网络获得的,而后者则是在一对相似和非相似的词上进行训练的。这个定制的神经网络包括lstm,它的一部分是读取单词中的字符序列。该模型将相似的文字映射到近端向量。这种方法允许为任何字符序列在向量空间中创建嵌入。chars2vec模型不保留任何嵌入字典,而是使用预训练模型生成嵌入向量。英语中有尺寸为50、100、150、200和300的预训练模型。该库提供了方便的用户api来为任意字符集训练模型。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpring事件发射器停止在新连接上向以前的客户端发送事件   javascript如何在Ionic 4中向选项卡添加模式?   java Hibernate hbm2ddl。自动更新不会删除mysql中的列   java如何使用instanceof根据子类类型对子类执行不同的操作?   java在JPanel中动态添加JLabel(重新验证无效)   java我的计算机上可以有两个版本的JDK吗?   spring在Java中管理每个表单提交的版本   java获取装饰器对象的所有类型:包装对象的类型和包装对象的类型   多线程Java区分可运行线程类型   javajavax。网ssl。SSLexException:填充长度无效   java JSP将单引号和双引号显示为符号   java当使用TestNG DataProvider时,有没有办法从同一个Excel工作表中读取和写入参数?   java不同的枚举哈希代码生成?   java ASM AdviceAdapter onMethodEnter打印所有参数   JavaStruts2(版本2.3.28)只接受注册的区域设置   excel如何使用Java中的Apache POI库对数据透视表数据进行排序   如果没有Kotlin库,是否可以将Kotlin翻译成Java?   安卓中用于JSON数据的java Junit