如何创建循环以查找Python中每个特性的权重?

2024-10-02 00:22:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样的数据集(无标签):

name   comedy  romantic ...
 AAA    0.34     0.67   ....
 bbb    0.12     0.88   ....

每一行代表一部电影,每一个特征都是一种类型,所有向量都是由字幕生成的

我所尝试的: 我使用余弦相似性来查找最相似的标题,并执行PCA,因此现在我得到了PC1-PC30的方差矩阵,并使用它来重新进行余弦相似性

预期结果: 我想比较使用PCA后的结果,例如,我想为PC1-PC30添加权重,这样我可以得到与前一个相似的结果,我的问题是如何编写一个函数来自动添加权重?非常感谢


Tags: 数据name电影代表特征标签相似性权重

热门问题