我有一个数据帧df
,如下所示
parent_id name
0 t3_35jfjt t1_cr4y72v
1 t3_35jfjt t1_cr4y7m7
2 t3_35jfjt t1_cr4y7p3
3 t1_cr4y72v t1_cr4y92z
4 t3_35jfjt t1_cr4y986
... ... ...
其中name
列中的所有元素都是唯一的。我想基于列parent_id
对列name
进行分区。这意味着name
列中的两个元素如果具有相同的parent_id
,则属于同一类
然后我想创建一个字典,其键是name
列中的元素,其值是这些元素所属类的元素数。比如说,
{'t1_cr4y72v': 3, 't1_cr4y72v': 4,...}
在本例中,t1_cr4y72v
属于基数为3的类
我可以使用一个循环来制作这本词典,但它效率不高,因为我有300多万行。你能详细说明一个有效的方法吗
import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/leanhdung1994/WebMining/main/df.csv', header = 0)
df
以下是一个解决方案:
另一个解决方案:
相关问题 更多 >
编程相关推荐