我有这样的数据集(无标签):
name comedy romantic ...
AAA 0.34 0.67 ....
bbb 0.12 0.88 ....
每一行代表一部电影,每一个特征都是一种类型,所有向量都是由字幕生成的
我所尝试的:
我使用余弦相似性来查找最相似的标题,并执行PCA,因此现在我得到了PC1-PC30的方差矩阵,并使用它来重新进行余弦相似性
预期结果:
我想比较使用PCA后的结果,例如,我想为PC1-PC30添加权重,这样我可以得到与前一个相似的结果,我的问题是如何编写一个函数来自动添加权重?非常感谢
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐