为从同一数据帧中提取的变量向数据帧添加新记录

import pandas as pd import numpy as np data = np.array([[160,90,'skirt_trousers', 'tight_comfy'],[180,100,'trousers_skirt', 'long_short']]) dford = pd.DataFrame(data, columns = ['height','size','order', 'preference'])

dataForTarget = np.array([['o1',160,90,'skirt', 'tight'],['o2', 180,100,'trousers', 'long'],['o1',160,90,'trousers', 'comfy'],['o2', 180,100,'skirt', 'short']]) Targetdford = pd.DataFrame(dataForTarget, columns = ['orderID','height','size','order', 'preference'])

variables = dford.columns.tolist() variables.append('ord1') secondord = dford.order.str.extractall (r'_(.*)') secondord = secondord.unstack() secondord.columns = secondord.columns.droplevel() dford1 = dford.join(secondord) dford1. columns = variables dford1.order = dford1.order.str.replace(r'(_.*)','') variables = dford1.columns.tolist() variables.append('pref1') secondpref = dford.preference.str.extractall (r'_(.*)') secondpref = secondpref.unstack() secondpref.columns = secondpref.columns.droplevel() dford2 = dford1.join(secondpref) dford2. columns = variables dford2.order = dford2.order.str.replace(r'(_.*)','')

2条回答

网友

1楼 · 编辑于 2024-06-25 07:02:02

使用^{}+^{}。将生成的数据帧与^{}连接起来，并使用^{}创建Hight和Size系列：

df=pd.concat([df.T for df in dford[['order','preference']].apply(lambda x: x.str.split('_',expand=True),axis=1)]).rename_axis(index='OrderID').reset_index() 

df['height']=df['OrderID'].map(dford['height'])
df['size']=df['OrderID'].map(dford['size'])
print(df)

   OrderID     order preference height size
0        0     skirt      tight    160   90
1        1  trousers      comfy    180  100
2        0  trousers       long    160   90
3        1     skirt      short    180  100

最后，将一个添加到OrderID列并添加字符o

df['OrderID']='o'+df['OrderID'].add(1).astype('str')
print(df)

  OrderID     order preference height size
0      o1     skirt      tight    160   90
1      o2  trousers      comfy    180  100
2      o1  trousers       long    160   90
3      o2     skirt      short    180  100

网友

2楼 · 编辑于 2024-06-25 07:02:02

将^{}与^{}和^{}一起用于新数据帧，并通过^{}添加到原始数据帧：

df = pd.concat([dford.pop('order').str.split('_', expand=True).stack().rename('order'), 
                dford.pop('preference').str.split('_', expand=True).stack().rename('preference')], axis=1)


dford = (dford.join(df.reset_index(level=1)).rename_axis('orderID')
              .reset_index()
              .sort_values(['level_1','orderID'])
              .drop('level_1', 1)
              .reset_index(drop=True)
              .assign(orderID = lambda x: 'o' + x['orderID'].add(1).astype('str')))

print (dford)
  orderID height size     order preference
0      o1    160   90     skirt      tight
1      o2    180  100  trousers       long
2      o1    160   90  trousers      comfy
3      o2    180  100     skirt      short

相关问题更多 >

编程相关推荐

热门问题

热门文章