根据列的值将数据帧拆分为两个文件

2024-09-25 02:38:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要把一个数据帧分成两部分。例如,如果下面的数据帧是基于Col1随机拆分的,那么两个文件都应该包含来自每个类别1、2和3的样本。你知道吗

Col1 col2 
1      a
1      b
2      c
2      d
3      e

到目前为止,我可以使用sklearn.cross_validation import train_test_split将数据分割成所需的比率。但我不知道如何从每个类别中提取样本。 一切帮助都将不胜感激。谢谢。你知道吗


Tags: 文件数据testimporttrainsklearn类别col2