特定条件下Python数据集的A/B拆分

+-----------------------------------+------------+ | CaseID | PersonID | +-----------------------------------+------------+ | 1 | 2 | | 1 | 3 | | 2 | 5 | +-----------------------------------+------------+

1条回答

网友

1楼 · 发布于 2024-05-20 17:21:15

对于此方法，您需要使用通常称为“拆分-应用-组合”的技术。为此，我们将使用Groupbys。你知道吗

您的第一项任务是将数据分成相关组。你知道吗

df_by_CaseID = df.groupby('CaseID')

在此之后，您将应用分割，您将不得不在这里投入一些工作，因为您将洗牌groupby对象，而不是dataframe。Read here for more on groupby.

然后可以使用pd.dataframe组合每个groupby项。你知道吗

在得到这个之后，一定要记住将这些数据洗牌，因为它将按caseID分组，这可能会对您的模型产生影响，如果您有疑问，请在下面进行评论。也checkout this,的概述解释。你知道吗

编程相关推荐

java RFID不完整输出？
java如何构造一个for循环来查找每个数组的第一个索引的总和
java Eclipse AST解析器正在删除我的规则
安卓如何在java中创建“可重写”配置？
java每次我向应用程序添加图像时，它都会崩溃
Java 8流到文件
EntityNotFoundException的java可能原因
java多线程为什么下面的程序表现得如此怪异？
java footprint soap api+mavenjaxb2plugin
java MongoDB锁定，直到找到结果

相关问题更多 >

编程相关推荐

热门问题

热门文章