如何根据其他列的值从数据帧中提取数据？

Actual df RTYPE PERIOD_ID STORE_ID MKT MTYPE RGROUP RZF RXF 0 MKT 317 13178 Kiosks_11 CELL NaN NaN NaN 1 MKT 306 11437 Kiosks_11 CELL NaN NaN NaN 2 MKT 306 12236 Kiosks_11 CELL NaN NaN NaN 3 MKT 312 11024 Kiosks_11 CELL NaN NaN NaN 4 MKT 307 13010 Kiosks_11 CELL NaN NaN NaN 5 MKT 307 12723 Kiosks_11 CELL NaN NaN NaN 6 MKT 306 14218 Kiosks_11 CELL NaN NaN NaN 7 MKT 306 13547 Kiosks_11 CELL NaN NaN NaN 8 MKT 316 12396 Kiosks_11 CELL NaN NaN NaN 9 MKT 306 10778 Cafes_638 CELL NaN NaN NaN 10 MKT 317 11230 Kiosks_11 CELL NaN NaN NaN 11 MKT 315 13630 Kiosks_11 CELL NaN NaN NaN 12 MKT 314 14113 Bars_13 CELL NaN NaN NaN 13 MKT 314 12089 Kiosks_11 CELL NaN NaN NaN

RTYPE PERIOD_ID STORE_ID MKT MTYPE RGROUP RZF RXF 0 MKT 20171411 3102300001 PM KA+PM PROV+SMKT+PETRO CELL NaN NaN NaN 1 MKT 20171411 3102300002 PM KA+PM PROV+SMKT+PETRO CELL NaN NaN NaN 2 MKT 20171411 3104001193 PM Provision CELL NaN NaN NaN 3 MKT 20171411 3104001193 PM KA+PM PROV+SMKT+PETRO CELL NaN NaN NaN 4 MKT 20171411 3104001193 Provision including MM CELL NaN NaN NaN 5 MKT 20171411 3104001641 PM Provision CELL NaN NaN NaN 6 MKT 20171411 3104001641 PM KA+PM PROV+SMKT+PETRO CELL NaN NaN NaN 7 MKT 20171411 3104001641 Provision including MM CELL NaN NaN NaN 8 MKT 20171411 3104001682 PM Provision CELL NaN NaN NaN 9 MKT 20171411 3104001682 PM KA+PM PROV+SMKT+PETRO CELL NaN NaN NaN 10 MKT 20171411 3104001682 Provision including MM CELL NaN NaN NaN 11 MKT 20171412 3104001682 Alcohol CELL NaN NaN NaN 12 MKT 20171412 3104001682 Fish CELL NaN NaN NaN 13 MKT 20171412 3104001684 Alcohol CELL NaN NaN NaN 14 MKT 20171412 3104001684 Fish CELL NaN NaN NaN

2条回答

网友

1楼 · 编辑于 2024-09-30 06:24:51

你可以通过听写理解：

dicta = {p: g.groupby('item')['store'].apply(tuple).to_dict()
         for p, g in df.groupby('period')}

[输出]

{1: {"'A'": (32, 34), "'B'": (32, 34)}, 2: {"'X'": (42, 44), "'Y'": (42, 44)}}

网友

2楼 · 编辑于 2024-09-30 06:24:51

创建MultiIndex Series并在字典理解中创建嵌套字典：

s = df.groupby(['period','item'])['store'].apply(tuple)

d = {level: s.xs(level).to_dict() for level in s.index.levels[0]}
print (d)
{1: {'A': (32, 34), 'B': (32, 34)}, 2: {'X': (42, 44), 'Y': (42, 44)}}

编辑：您可以按period分组，然后将item转换为集合，再转换为元组：

d1 = {k:tuple(set(v)) for k, v in df.groupby('period')['item']}
print (d1)
{1: ('A', 'B'), 2: ('X', 'Y')}

d1 = df.groupby('period')['item'].apply(lambda x: tuple(set(x))).to_dict()
print (d1)
{1: ('A', 'B'), 2: ('X', 'Y')}

相关问题更多 >

编程相关推荐

热门问题

热门文章