2024-09-25 02:38:26 发布
网友
我需要把一个数据帧分成两部分。例如,如果下面的数据帧是基于Col1随机拆分的,那么两个文件都应该包含来自每个类别1、2和3的样本。你知道吗
Col1 col2 1 a 1 b 2 c 2 d 3 e
到目前为止,我可以使用sklearn.cross_validation import train_test_split将数据分割成所需的比率。但我不知道如何从每个类别中提取样本。 一切帮助都将不胜感激。谢谢。你知道吗
sklearn.cross_validation import train_test_split
看看StratifiedKFold对象。你知道吗
StratifiedKFold
http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.StratifiedKFold.html
文档中有一个简短的示例,说明如何使用它
看看
StratifiedKFold
对象。你知道吗http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.StratifiedKFold.html
文档中有一个简短的示例,说明如何使用它
相关问题 更多 >
编程相关推荐