Pandas数据帧基于d中的数据向df添加行

Cust-id Sex Country Audi Ferrari Porsche Jaguar 0 Cu1 F FR R8 FF NA NA 1 Cu2 M US NA NA NA XF 2 Cu3 M UK RS7 NA NA NA 3 Cu4 F RU NA NA 911 NA 4 Cu5 M US NA NA 918 Ford 5 Cu6 F US S6 NA NA F-type 6 Cu7 M UK A8 NA MacanS XE

Cust-id Sex Country Audi Ferrari Porsche Jaguar 0 Cu1 F FR R8 NA NA NA 1 Cu1 F FR NA FF NA NA 2 Cu2 M US NA NA NA XF 3 Cu3 M UK RS7 NA NA NA 4 Cu4 F RU NA NA 911 NA 5 Cu5 M US NA NA 918 NA 6 Cu5 M US NA NA NA Ford 7 Cu6 F US S6 NA NA F-type 8 Cu7 M UK A8 NA NA NA 9 Cu7 M UK NA NA MacanS NA 10 Cu7 M UK NA NA NA XE

2条回答

网友

1楼 · 编辑于 2024-10-03 19:30:08

import pandas as pd

df = pd.DataFrame({'Audi': ['R8', 'NA', 'RS7', 'NA', 'NA', 'S6', 'A8'],
 'Country': ['FR', 'US', 'UK', 'RU', 'US', 'US', 'UK'],
 'Cust-id': ['Cu1', 'Cu2', 'Cu3', 'Cu4', 'Cu5', 'Cu6', 'Cu7'],
 'Ferrari': ['FF', 'NA', 'NA', 'NA', 'NA', 'NA', 'NA'],
 'Jaguar': ['NA', 'XF', 'NA', 'NA', 'Ford', 'F-type', 'XE'],
 'Porsche': ['NA', 'NA', 'NA', '911', '918', 'NA', 'MacanS'],
 'Sex': ['F', 'M', 'M', 'F', 'M', 'F', 'M']})

result = pd.melt(df, id_vars=['Cust-id', 'Sex', 'Country'])
mask = result['value'] != 'NA'
result = result.loc[mask]
result['index'] = result.index
result = pd.concat([result[['Cust-id', 'Sex', 'Country']], 
           result.pivot(index='index', columns='variable', values='value')], axis=1)

print(result)

收益率

   Cust-id Sex Country  Audi Ferrari  Jaguar Porsche
0      Cu1   F      FR    R8    None    None    None
2      Cu3   M      UK   RS7    None    None    None
5      Cu6   F      US    S6    None    None    None
6      Cu7   M      UK    A8    None    None    None
7      Cu1   F      FR  None      FF    None    None
15     Cu2   M      US  None    None      XF    None
18     Cu5   M      US  None    None    Ford    None
19     Cu6   F      US  None    None  F-type    None
20     Cu7   M      UK  None    None      XE    None
24     Cu4   F      RU  None    None    None     911
25     Cu5   M      US  None    None    None     918
27     Cu7   M      UK  None    None    None  MacanS

可以使用^{}将car列合并为一个列：

In [232]: result = pd.melt(df, id_vars=['Cust-id', 'Sex', 'Country']); result.head()
Out[232]: 
  Cust-id Sex Country variable value
0     Cu1   F      FR     Audi    R8
1     Cu2   M      US     Audi    NA
2     Cu3   M      UK     Audi   RS7
3     Cu4   F      RU     Audi    NA
4     Cu5   M      US     Audi    NA
...

删除具有'NA'字符串值的行：

mask = result['value'] != 'NA'
result = result.loc[mask]

然后使用^{}来重塑结果。pivot是roughly the inverse of ^{}它将一列中的值（例如'variable'）分散到多个列中，从而取消合并car列。你知道吗

result['index'] = result.index
result = pd.concat([result[['Cust-id', 'Sex', 'Country']], 
           result.pivot(index='index', columns='variable', values='value')], axis=1)

result['index'] = result.index用于确保数据透视按原样保留行。你知道吗

网友

2楼 · 编辑于 2024-10-03 19:30:08

我的方法如下：

迭代每个car列，只保留具有非空值的记录

df_dict = {}

for car in ['Audi', 'Ferrari', 'Porsche' ,'Jaguar']:  

    non_nulls = df[ df.apply(lambda x: not pd.isnull(x[car] ), axis=1)]

    df_dict[car] = non_nulls[[Cust-id,Sex,Country, car]]

用pd.concat连接数据帧，这将在正确的位置创建空值
```
final_df = pd.concat( df_dict.values() )
```

沿着这条路线应该会有效果。虽然没有测试我的代码，所以用你自己的判断！你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章