如何获得Python中每个人最具共同特征的人的列表？

Person Trait_1 Trait_2 Trait_3 Trait_4 A 1 1 1 1 B 0 1 1 0 C 0 1 0 0 D 1 1 0 1 E 0 0 0 1

3条回答

网友

1楼 · 编辑于 2024-09-29 23:24:03

这更像是一个线性代数的答案，但如果你想知道人a和人B之间的共同特征的数量，你可以计算人a的线向量和人B的线向量的标量积（这只起作用，因为你的矩阵是二进制矩阵）

我不知道您使用的是什么框架/库，但如果您使用的是pandas，您可以轻松提取线向量并将其转换为numpy数组，然后进行标量积

网友

2楼 · 编辑于 2024-09-29 23:24:03

尝试：

# if not done already
df.set_index("Person", inplace=True)

res = (df@df.T).stack().reset_index(level=1)

res = res.loc[res["Person"].ne(res.index) & res[0].gt(0)].sort_values(0, ascending=False).groupby(level=0).apply(lambda x: list(x.values))

产出：

>>> res

Person
A    [[D, 3], [B, 2], [C, 1], [E, 1]]
B            [[A, 2], [C, 1], [D, 1]]
C            [[A, 1], [B, 1], [D, 1]]
D    [[A, 3], [B, 1], [C, 1], [E, 1]]
E                    [[A, 1], [D, 1]]
dtype: object

和您的函数（结果按降序排列）：

>>> res.loc['C']

[array(['A', 1], dtype=object), array(['B', 1], dtype=object), array(['D', 1], dtype=object)]

网友

3楼 · 编辑于 2024-09-29 23:24:03

创建一个数据帧

import pandas as pd
df = pd.DataFrame(data=[[1, 1, 1, 1],
                        [0, 1, 1, 0],
                        [0, 1, 0, 0],
                        [1, 1, 0, 1],
                        [0, 0, 0, 1]],
                 index=['A', 'B', 'C', 'D', 'E',],
                 columns=['Trait_1', 'Trait_2', 'Trait_3', 'Trait_4'])

使用矩阵乘法创建常见特征的矩阵（您描述的）

common_traits = df @ df.T

为每个人打印你想要的字符串（最具共同特征的前10位人物）

n = 10
for index, row in common_traits.iterrows():
    top10 = row.drop(index).nlargest(n)
    top10 = top10[top10 > 0]
    string = ', '.join(top10.index + top10.map(lambda x: f' ({x} trait{"s" if x != 1 else ""})'))
    print(f'{index}: {string}')

输出

A: D (3 traits), B (2 traits), C (1 trait), E (1 trait)
B: A (2 traits), C (1 trait), D (1 trait)
C: A (1 trait), B (1 trait), D (1 trait)
D: A (3 traits), B (1 trait), C (1 trait), E (1 trait)
E: A (1 trait), D (1 trait)

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何获得Python中每个人最具共同特征的人的列表？

输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >