计算pandas d中唯一值的循环

import pandas as pd d = ({ 'Code' : ['A','A','A','A','B','A','B','A','A','A'], 'Area' : ['Home','Work','Shops','Park','Cafe','Home','Cafe','Work','Home','Park'], }) df = pd.DataFrame(data=d) #Select value df1 = df[df.Code == 'A'].copy() df1['u'] = df1[::-1].groupby('Area').Area.cumcount() ids = [1] seen = set([df1.iloc[0].Area]) dec = False for val, u in zip(df1.Area[1:], df1.u[1:]): ids.append(ids[-1] + (val not in seen) - dec) seen.add(val) dec = u == 0 df1['On'] = ids df1 = df1.reindex(df.index).fillna(df1)

Code Area u On 0 A Home 2.0 1.0 1 A Work 1.0 2.0 2 A Shops 0.0 3.0 3 A Park 1.0 3.0 4 B Cafe 1.0 1.0 5 A Home 1.0 3.0 6 B Cafe 0.0 1.0 7 A Work 0.0 3.0 8 A Home 0.0 2.0 9 A Park 0.0 1.0

3条回答

网友

1楼 · 编辑于 2024-05-20 09:09:38

将GroupBy与size和cumcount一起使用，可以构造u系列。在

你的逻辑On不清楚：这需要澄清。在

g = df.groupby(['Code', 'Area'])
df['u'] = g['Code'].transform('size') - (g.cumcount() + 1)

print(df)

  Code   Area  u
0    A   Home  2
1    A   Home  1
2    B  Shops  1
3    A   Park  1
4    B   Cafe  1
5    B  Shops  0
6    A   Home  0
7    B   Cafe  0
8    A   Work  0
9    A   Park  0

网友

2楼 · 编辑于 2024-05-20 09:09:38

此过程将您的工作流应用于表中的每个代码：

def yourFunc(df1):
    df1['u'] = df1[::-1].groupby('Area').Area.cumcount()

    ids = [1]
    seen = set([df1.iloc[0].Area])
    dec = False
    for val, u in zip(df1.Area[1:], df1.u[1:]):
        ids.append(ids[-1] + (val not in seen) - dec)
        seen.add(val)
        dec = u == 0
    df1['On'] = ids

    df1 = df1.reindex(df.index).fillna(df)
    return(df1)

test = df.groupby('Code').apply(yourFunc)

测试：

^{pr2}$

网友

3楼 · 编辑于 2024-05-20 09:09:38

我觉得你的逻辑很混乱。也就是说，我想我可以复制它：

df["u"] = df.groupby(["Code", "Area"]).cumcount(ascending=False)
df["nunique"] = pd.get_dummies(df.Area).groupby(df.Code).cummax().sum(axis=1)
df["On"] = (df["nunique"] - 
           (df["u"] == 0).groupby(df.Code).cumsum().groupby(df.Code).shift().fillna(0)

这给了我

^{pr2}$

其中，u是该行之后匹配（代码、区域）对的数目。nunique是到目前为止在该代码中看到的唯一面积值的数目。 On是到目前为止看到的独特区域的数量，除了一旦我们“用完”一个不再使用的区域，我们就开始从nuniq中减去它。在

相关问题更多 >

编程相关推荐

热门问题

热门文章