从共现矩阵计算嵌入的python包
glove的Python项目详细描述
#glove
cython glove多线程训练的一般实现。
glove是一种无监督的学习算法,用于生成单词的矢量表示。
训练使用来自语料库的共现矩阵。结果表示包含对许多其他任务有用的结构。
描述模型的论文是[这里](http://nlp.stanford.edu/projects/glove/glove.pdf)。
此机器学习模型的原始实现可以[在这里找到](http://nlp.stanford.edu/projects/glove/)。
@author jonathanraiman
0:0以下与2、3.5次共发生2、3.5次:
``Python
>型号=手套。手套(cooccur,vocab_size=3,d=50,alpha=0.75,x最大值=100.0)
对于范围(25)内的历元(25):
err=model.train(批量=200,工人=9,批量=50)
print(历元%d,误差%3f”%(历元,err,flsh=true)
`>``
>对于范围(25)内的历元,err=model.train(批量=200,工人=9,批量=9,批量=50)
print(“历元%d,误差%3f”%(历元,errr,errr%,flsh
###手套。u init_uu()
*`cooccurence`dict<;int,dict<;int,float>;:共现矩阵
*`alpha` float:(默认值0.75)用于控制归一化共现计数的指数的超参数。
*`x_max` float:(默认值100.0)用于控制共现矩阵中常见项的平滑的超参数。
*`d`int:(默认值50)学习向量的嵌入维数
*` seed`int:(默认值1234)随机种子
\globe.train
*`step_u size` float:模型的学习率
*`workers`int:用于培训的工作线程数
*`batch_u size`int:每个线程应该接收多少示例(控制作业队列的大小)
cython glove多线程训练的一般实现。
glove是一种无监督的学习算法,用于生成单词的矢量表示。
训练使用来自语料库的共现矩阵。结果表示包含对许多其他任务有用的结构。
描述模型的论文是[这里](http://nlp.stanford.edu/projects/glove/glove.pdf)。
此机器学习模型的原始实现可以[在这里找到](http://nlp.stanford.edu/projects/glove/)。
@author jonathanraiman
0:0以下与2、3.5次共发生2、3.5次:
``Python
>型号=手套。手套(cooccur,vocab_size=3,d=50,alpha=0.75,x最大值=100.0)
对于范围(25)内的历元(25):
err=model.train(批量=200,工人=9,批量=50)
print(历元%d,误差%3f”%(历元,err,flsh=true)
`>``
>对于范围(25)内的历元,err=model.train(批量=200,工人=9,批量=9,批量=50)
print(“历元%d,误差%3f”%(历元,errr,errr%,flsh
###手套。u init_uu()
*`cooccurence`dict<;int,dict<;int,float>;:共现矩阵
*`alpha` float:(默认值0.75)用于控制归一化共现计数的指数的超参数。
*`x_max` float:(默认值100.0)用于控制共现矩阵中常见项的平滑的超参数。
*`d`int:(默认值50)学习向量的嵌入维数
*` seed`int:(默认值1234)随机种子
\globe.train
*`step_u size` float:模型的学习率
*`workers`int:用于培训的工作线程数
*`batch_u size`int:每个线程应该接收多少示例(控制作业队列的大小)