从多个数据帧列中可视化公共字符串值的好方法是什么?

2024-10-01 02:29:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我有多个数据帧(每个城市一个),其中“Name”列表示来自该城市的组织名称。你知道吗

我怎样才能把每两个城市的共同名字和所有城市的共同名字形象化,这样就容易理解了?你知道吗

示例:

  df1            df2

  Name           Name       
'Apollo'        'Kims'
'MedWorks'      'AIMs'
'Cradle'        'Apollo'
'Kims'          'Bronte Co'
'Collins'       'Cradle'

每个城市有10个以上的通用值(名称)。我不确定维恩图是否适用于字符串值,但即使它们适用于字符串值,也无法以良好的格式容纳所有数据。你知道吗

尝试this as suggested但我得到:

TypeError: unsupported operand type(s) for -: 'str' and 'str'

Tags: 数据字符串name名称示例名字df1df2
1条回答
网友
1楼 · 发布于 2024-10-01 02:29:44

使用^{}

import pandas as pd
from matplotlib_venn import venn2

set1 = set(df1['Name'])
set2 = set(df2['Name'])

venn = venn2([set1, set2])
venn.get_label_by_id('100').set_text('\n'.join(map(str,set1-set2)))
venn.get_label_by_id('110').set_text('\n'.join(map(str,set1&set2)))
venn.get_label_by_id('010').set_text('\n'.join(map(str,set2-set1)))
# venn.get_label is quoted from https://stackoverflow.com/questions/55717203/plot-actual-set-items-in-python-not-the-number-of-items

输出:

enter image description here

相关问题 更多 >