对数据帧系列值进行分类

2024-06-02 01:58:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新来的熊猫和尝试自动创建类别和分组的价值观。你知道吗

我的数据帧:

df = pd.DataFrame({'Slug': ['a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c'],
                   'Position': ['0', '1', '2', '3', '4', '0', '1', '2', '3', '0', '1', '2'],
                   'Brand': ['Mazda', 'BMW', 'Ford', 'Fiat', 'Dodge', 'Mazda', 'BMW', 'Ford', 'Fiat', 'BMW', 'Ford', 'Fiat'],
                   'Sessions': ['70', '', '', '', '', '60', '', '', '', '50', '', ''],
                   'Transactions': ['1', '', '', '', '', '2', '', '', '', '3', '', ''],
                   'Ecommerce': ['1', '', '', '', '', '3', '', '', '', '4', '', ''],
                   'CTR': ['10', '', '', '', '', '15', '', '', '', '5', '', ''],
                   'All': ['11', '', '', '', '', '1', '', '', '', '4', '', '']})

我想回答一个问题:哪种品牌布局的转化率最好。Position栏展示了品牌在网站上的记录方式:

示例:

0 A #Ford
1 B #BMW
2 C #Fiat
3 D #Dodge

问题是,也许福特排在第二位,宝马排在第一位会导致更多的改装。你知道吗

我要做的第一件事是为每个独特的群体生成分类,有大约10个不同的品牌和100种不同的设置方式。你知道吗

例如:

组1可以是:

0 A #Ford
1 B #BMW
2 C #Fiat
3 D #Dodge

组2可以是:

0 B #BMW
1 A #Ford
2 C #Fiat
3 D #Dodge

然后我的数据帧会像这样:

Slug    Group   Sessions    Transactions   Ecommerce    CTR     All
a       1       70          1              1            10      10
b       2       60          2              3            15      11
c       1       60          2              3            15      11
d       3       60          2              3            15      11
e       2       60          2              3            15      11

Groupspositionbrand列分类。 Slug可以理解为一个国家。例如,在a国,实现了第1组70次会议的布局,在b国,实现了第2组60次会议的布局,以此类推。你知道吗

以此类推,然后我可以比较sessionstransactions中的组性能度量值和数据帧中的其他列值。你知道吗

transactionssession等参数是针对整个品牌布局的,例如:

0 Ford
1 BMW
2 Fiat
3 Dodge
# this layout achieved 70 sessions and 5 conversions

所以我的问题可以分为三个部分:

1)如何生成positionbrand

2)也许你们中的一些人遇到过类似的助教,知道如何确定brands的最佳布局

3)我尝试了一些机器学习,也许你可以建议我用哪种模式来解决我的问题

谢谢你的建议。你知道吗


Tags: 数据position布局allfiatsessionstransactionsslug