Countvectorizer具有功能名称,如下所示
vectorizer = CountVectorizer(min_df=10,ngram_range=(1,4), max_features=15000)
vectorizer.fit(X_train['essay'].values) # fit has to happen only on train data
X_train_essay_bow = vectorizer.transform(X_train['essay'].values)
feature_names= vectorizer.get_feature_names()
手套向量的特征名称是什么
如何获取这些功能名称
with open('glove_vectors', 'rb') as f:
model = pickle.load(f)
glove_words = set(model.keys())
我有300维的手套向量文件,如上图所示
手套向量的300维的名称是什么
手套功能没有名称。CountVectorier统计每个句子中每个标记的出现次数。因此,这些功能具有易于理解的名称。特征“cat”是标记“cat”的每个句子中的计数
对于手套向量,策略是完全不同的,并且没有等价的特征表示。手套向量是单词在抽象的N维空间中的嵌入
一个令牌的手套矢量来自于将令牌作为输入输入到训练的神经网络中,并在中间激活自动编码层。p>
如果你曾经训练过一个深层的神经网络,想象一下选择其中的某个隐藏层。隐藏层中每个节点的特征名称是什么?这是一个毫无意义的问题,因为节点不是特征;它们的存在是为了将激活传递到下一层。手套矢量特征也是如此;它们是网络中隐藏层的激活值
相关问题 更多 >
编程相关推荐