Python Pandas DataFrame如果索引包含任何字符串值，则应用Label，否则应用不同的Lab

Search term Impressions Clicks Cost Converted clicks american brewing 286446 104862 8034.18 6831 american brewing supplies 165235 64764 3916.48 4106 brewing supplies 123598 8131 6941.87 278 wine bottles 272969 7438 4944.7 194 www americanbrewing com 2782 1163 227.17 120 home brewing 216138 3744 3468.24 110 wine making 147985 6602 5024.54 108

import pandas as pd import numpy as np brand_terms = ['american brewing', 'americanbrewing'] data = pd.read_csv(r'sqr.csv', encoding='cp1252') df = pd.DataFrame(data) df['Search term'] = df['Search term'].replace(r'[^\w&\' ]', '', regex=True) df['Cost'] = df['Cost'].replace(r'[^\d\.]', '', regex=True).astype('float') #print(df.dtypes) grouped = df.groupby('Search term') result = grouped[['Impressions', 'Clicks', 'Cost', 'Converted clicks']].sum() result = result.sort(['Converted clicks','Cost'], ascending=False) #This doesn't work result['Label'] = result.where(result['Search term'].str.contains('|'.join(brand_terms), 'Brand', 'Non-brand')) result.to_csv('sqr_aggregate.csv')

2条回答

网友

1楼 · 编辑于 2024-10-02 18:19:42

如果您不想重置索引，这里有一种方法。在

您可以将index转换为Series，并应用转换。在

In [16]: np.where(pd.Series(df.index).str.contains('american brewing|americanbrewing'),
                  'Brand', 'Non-Brand')
Out[16]:
array(['Brand', 'Brand', 'Non-Brand', 'Non-Brand', 'Brand', 'Non-Brand',
       'Non-Brand'],
      dtype='|S9')

网友

2楼 · 编辑于 2024-10-02 18:19:42

尝试更改代码以使用df.groupby('Search term', as_index = False)。在

相关问题更多 >

编程相关推荐

热门问题

热门文章